语音编码技术的性能分析

k . Satyapriya¹(M.Tech) Yugandhar Dasari²

PG学生(VLSI SD),部门的ECE Aditya理工学院管理、Tekkali、印度
副教授,ECE称,Aditya理工学院管理、Tekkali、印度

文摘

语音编码是数字语音处理领域的重要问题。语音编码是将语音信号转换的行为在一个更紧凑的形式,可以用一些数字传输的二进制位数。它不可能访问的无限带宽通道每次我们发出一个信号在它导致代码和压缩语音信号。演讲需要压缩领域的长途通信、高质量的语音存储和消息加密。例如在数字蜂窝技术许多用户需要共享相同的频率带宽。利用语音压缩使更多的用户共享可用的系统。语音压缩的另一个例子是需要在数字语音存储为一个固定数量的可用内存压缩可以存储时间信息。语音编码是一种有损压缩的编码,这意味着输出信号听起来不完全输入。线性预测编码,波形编码和子带编码技术用于传输语音从一个地方到另一个地方。实现上述三个编码技术来检查他们的表现措施压缩比和语音声音质量。

关键字

线性预测编码(LPC)波形编码、子带编码

我的介绍。

语音编码就是代表的过程有效的传输或存储的语音信号。这些代码将被发送在带限有线和无线频道。语音编码的目的是代表语音信号的样本在一个紧凑的形式将更少的代码符号没有降低语音信号的质量。语音编码在细胞和移动通信是非常重要的。它也被运用于互联网协议语音(VOIP),视频会议,电子玩具、存档、数字同步语音和数据(DSVD),大量的以计算机为基础的游戏和多媒体应用。此外,大多数的语音应用程序需要最小编码延迟为了避免阻碍流动的长编码的语音对话,因为延误

演讲编码器是一个数字化语音信号转换成编码表示和传输帧的形式。在接收端,演讲解码器接收到编码框架和综合重构语音信号。语音编码人员主要不同码率、延迟、复杂性和知觉合成信号的质量。有两种类型的编码技术如窄带和宽带语音编码。窄带语音编码是语音信号的编码带宽300至3400赫兹之间8 khz采样率而宽带语音编码的编码语音信号带宽小于50到7000赫兹和采样率14 - 16千赫采样率。在最近几天,有需求的增加宽带语音编码技术在视频会议等应用程序。

语音编码的目的是压缩语音信号通过减少每个抽样的比特数,但不应该失去语音的质量。解码演讲应该毫不掩饰的原始语音信号。特别是语音编码方法实现以下收益:

比特率减少或者同样的带宽。比特率降低导致减少内存需求,以适当的方式对码率降低。

比特率降低导致减少所需的传动功率、压缩演讲以来每秒传输的比特数少。

免疫噪音,一些保存位/样本可以用作保护错误控制位演讲参数。

语音编码技术主要是两种类型都是1。无损和2。有损编码方法。有损编码技术的重建语音信号感知不同于原始的语音信号而无损编码技术,在解码器端重构信号的完全相同的形状作为输入语音信号。主要是语音编码技术是基于有损压缩编码技术,因为它从知觉中删除无关紧要的信息质量的观点。

语音编码人员进行分类基于它们所产生的码率输出合理的质量和类型的编码技术用于语音信号的编码。

有不同的语音编码器类型表1比特率,算法复杂度和四个标准化应用程序描述的四个一般类的程序员

线性预测编码(lpc),假定输出语音信号是线性时不变(LTI)模型的言论。我们假设整机全极系统的传递函数模型。激励函数是一种准周期信号是由离散的脉冲(每基音周期1 - 8),伪随机噪声,或两者的组合。励磁信号生成的接收机是基于基音周期传输和表达信息,则系统被指定为一个LPC声码器。提供额外的信息关于激励信号的频谱形状叫做LPC声码器,编码器所采用标准的2.0和4.8 kbps之间。另一方面,LPC-based综合分析程序员(LPC-AS)需要大量的候选励磁和选择最好的一个。使用这些LPC-AS程序员之间在大多数标准4.8和16 kbps。在编码的语音信号波形的波形编码概念是一样应用语音信号波形,不考虑生产和言语知觉人类语言的本质。这些程序员high-bit-rate程序员(上图16 kbps)。子带编码是试图用参数表示语音信号频域编码人员的光谱属性在不同的频段。这些程序员不如LPC-based程序员广泛使用。

二世。线性预测编码

线性预测编码(LPC),一个强大的、高质量、低比特率的语音分析技术对语音信号的编码。源滤波器模型中使用LPC分析也称为线性预测编码模式。它有两个主要组件LPC分析(编码)和LPC合成(解码)。LPC分析的目标是估计语音信号是否有声的或无声的笑,找到每一帧的音高和构建源滤波器模型所需的参数。这些参数被传输到接收者将开展LPC合成使用接收到的参数。

语音信号是过滤到多个系统采样频率的一半,然后进行A / D转换。LPC的编码和解码过程在以下步骤中详细解释。

线性预测编码:

第一步:读语音信号在数字格式。

步骤2:选择LPC系数分别为10和帧时间长度的30 ms这帧长度就变成了331。

步骤3:语音信号分帧,每一帧将被处理如下所示。

第四步:预加重每一帧之前做进一步处理。

第五步:找到滤波器响应计算大小和功能。计算零交叉和基音周期。

第六步:为msf设置阈值,零交叉和基音周期。

第七步:检查是否帧是否表示基于步骤6。

第八步:LPC-10系数、增益和音高阴谋计算基于框架是有声的或无声的笑。

步骤9:现在获得的值在步骤8传输使用的编码过程。

第十步:在接收机接收到信号并解码到所需的形式

步骤11:最初的验证和接收信号。

线性预测编码(LPC)的言论:

语音分析和合成线性预测编码(LPC)方法是基于建模声道整机全极(IIR)滤波器的线性系统的传递函数

“是极数,在哪里的参数确定波兰人和滤波器增益,。有两个语音浊音和清音的激发函数模型。随机噪声发生器的输出会产生无声的整机全极过滤器通过激动人心的声音。另一方面,通过一个周期脉冲序列表示演讲是由兴奋全极点滤波器模型。

的根本区别这两个语音浊音和清音的来自他们生产的方式。声带振动产生这些表达的声音。声带振动速度决定声音的音高而;无声的声音并不取决于声带的振动。的收缩的声道无声的产生。声道的收缩力空气产生了无声的声音声道时开放

给定一个短的一段语音信号,让我们说女士约20或160个样本的采样率8 KHz,发射机的语音编码器必须确定适当的激发函数,表示语音的基音周期,获得和系数美联社[k]。下面的框图描述线性预测的编码器/解码器

编码。确定模型的参数自适应地从数据和建模成一个二进制序列和传递给接收者。在接收端,模型和励磁信号合成语音信号。

整机全极滤波器模型的参数确定的语音样本通过一个线性预测。线性预测滤波器的输出

观察到的样本之间的误差(n)和预测价值年代(n)

通过最小化平方误差的总和确定极点参数模型的美联社(k)。差异化的结果和对每一个参数和方程的结果为零,

其中m = 1, 2,每分钟…

三世。波形编码

波形编码是最简单的语音编码技术。波形编码人员分析代码和重建原始信号,样本的样本。波形编码是用来繁殖的语音信号波形的形状,不考虑人类语言生产和交付系统的性质。波形编码是有用的应用程序,需要成功的演讲和交际信号的编码。在公共交换电话网络(PSTN),例如,成功传输的调制解调器和传真信号音调,和开关信号几乎是一样重要的成功传播的演讲。最常用的波形编码算法统一16位PCM,压缩扩展8位PCM和ADPCM。

波形编码是探索在时域和频域。利用信号时域波形编码冗余像周期性,缓慢不同强度等和光谱(频率)域编码利用语音信息的非均匀分布在全频带。脉冲编码调制(PCM),差分脉码调制(DPCM),增量调制(DM)是一些流行的时域波形编码技术和变换编码(TC),子带编码(SBC)很少光谱域波形编码技术。

3.1 PCM:

PCM是最好的已知波形编码技术进行量化和编码每个样本的言论有限数量的比特值。在PCM编码语音样本,振幅可以无限可能的值,与有限的振幅和关闭在这些选择代表实际的振幅。所选的离散值都被分配一个二进制代码字数字化得到用于传输或存储的言论。PCM是常用的传输带宽和存储空间等资源不是一个限制。在一个简单的量化器之间的间距称为均匀量化离散振幅保持相同的水平。

脉冲编码调制(PCM)这个名字是指内存更少的编码算法,量化每个样本

s (n)通过使用相同的重建水平^年代,k = 0,。m。,K,不管以前的样本的值。重构信号年代ˆ(n)是由

3.2统一PCM:

统一的PCM的量化算法重建水平均匀分布Smax和股市之间的关系。制服PCM的优势量化误差功率不依赖于信号功率;大功率信号量化与相同的分辨率低功率信号。在PCM数字音频16位制服是一个标准的编码方案。统一的PCM编码误差功率和信噪比随比特率在一个简单的时尚。

四、语音编码的基本原理和应用

4.1压缩扩展PCM:

4.2波形编码:

第一步:读语音信号在数字格式。

步骤2:确定“亩”值和“位数”并使用mulaw压缩语音信号压缩使用表达式(13)

步骤3:现在信号传播

步骤4:在接收机接收到信号并扩大使用μ律压缩

第五步:验证原始和接收信号。

4.3子频带编码:

子频带编码是一种有效的方法来实现语音信号的数据压缩。域低频是将源信号分解为多个组成部分,分别解码部分。隔离的系统组成部分对应于特定的频率称为滤波器。如果隔离低频组件,它被称为低通滤波器。如果隔离高频组件,它被称为高通滤波器类似,我们有带通滤波器。一般来说,一个过滤器可以称为一个副环带过滤器,如果同时隔离的乐队。最常用的滤波器在域低频由一连串的阶段,在每个阶段由低通滤波器和一个高通滤波器。

子频带编码方案的三个主要组成部分

分析和合成过滤器

比特分配方案

的编码方案

如果我们应用过滤器银行计划,源输出通过过滤器。过滤器银行涵盖了设计源输出的频率范围。每个滤波器的通带指定每组的频率可以通过。现在大量毁灭过程开始,采样的输出过滤器是子这降低了采样样本的数量。子采样的理由是奈奎斯特抽样规则及其扩展证明了下来。大批杀害的数量取决于滤波器的带宽的比例输出滤波器的输入。然后给摧毁的编码器输出信号编码使用的编码方案之一,包括ADPCM, PCM,矢量量化。

语音信号从而获得量化和编码的压缩方案的选择和分解之间的分配比特。这个配置过程极大地影响最终的重建质量。不同的分解有不同数量的信息。这个信号通过信道传输。

传输信号接收和合成。量化和编码系数是用来重建表示原始信号的译码器。样品从每个子带编码解码和取样。银行重建过滤器会给不同的输出相结合形成最终的重建的输出信号。域低频算法应用在语音编码、音频编码和图像压缩。

子带编码:

第一步:读语音信号在数字格式。

步骤2:语音信号是使用小波分析分解到两个级别的过滤器。

步骤3:现在这些小波系数部分传播实现压缩通过识别接收信号的质量。

步骤4:接收器,语音信号是使用小波重构合成过滤器。

第五步:验证原始和接收信号。

诉结果

六。结论

LPC的重建语音的低音比原来的演讲。子带编码系统大大减少了误差和压缩由采样率转换和控制多重速率的信号处理。波形编码将显著压缩和高质量的声音。

引用

介绍数字语音处理(信号处理中的基础和趋势)劳伦斯·R。拉宾(作者),罗纳德·w·谢弗(作者)。
线性预测的演讲中,J。D马克尔。小H灰色页面[10]- [96],[190],[258]。
即Gerson和m . Jasiuk矢量和兴奋的线性预测(VSELP),在b . s .阿塔尔•v . s . Cuperman,和a . Gersho eds。语音编码的发展,提供参考,多德雷赫特,荷兰,1991年,页69 - 80。
沈b, A, A . Alwan g . Pottie perceptuallybased嵌入式可语音编码器,IEEE反式。演讲音频的过程。5(2):131 - 140(1997年3月)。
史密斯,B。,Instantaneous Companding of Quantized Signals, Bell System Technical Journal, Vol. 36, May 1957, pp. 653–709.
4 s Yeldener kbps人数质量谐波激励线性预测语音编码器,Proc。ICASSP, 1999年,页481 - 484。
金子,H。,A Unified Formulation of Segment Companding Laws and Synthesis of Codecs and Digital Compandors, Bell System Technical Journal, Vol. 49, September 1970,pp. 1555–1558.
r·考克斯等人在域低频新方向,IEEE JSAC, 6(2): 391 - 409(1988年2月)。