窄带无线信道语音编码与传输 声码器(Vocoder)技术

声码器:将人的发声系统抽象成数学模型,对模型参数编码。

声码器的特点:

高压缩率:编码速率可 < 2.4kb/s。

自然度较差:舍弃了语音的精细内容,导致自然度较差。

抗毁能力差:在极低编码速率下,每个 bit 都承载相当的信息量。误码造成的 bit 翻转导致参数的错误,对合成语音的影响是灾难性的。低鲁棒性与生俱来。

算法复杂。

声码器算法实现及产品化过程:

建模:根据人的发声机理建立数学模型;

浮点实现:用计算机浮点程序实现模型,根据实际应用优化算法,使之满足要求;

定点化:将浮点程序定点化,其过程会带来损伤。如果定点化的人精通算法,将最大限度减少损失;

DSP化:用 DSP 汇编实现定点程序。这一步可以将资源需求减少到定点程序的几十到几百分之一;

硬件加载:设计硬件模块,完成各种接口、驱动。最终加载程序,实现高压缩率的语言编码功能。

目前国际上主流声码器算法:

美国政府标准:MELPe 2.4kb/s、1.2kb/s;

NATO: 0.6kb/s; 

美国 DVSI 公司 :AMBE+2TM 2.45kb/s 等速率;

俄罗斯 RALCWI2 2.4kb/s;

中国:信瑞递公司:ASELP 2.4kb/s、 2.15kb/s、 1.2kb/s、0.6kb/s 、0.3kb/s 等速率。

声码器主要技术指标

重建语音质量

延时

鲁棒性

计算复杂度

存储量

运算量

重建语音质量测试方法

测试准则:采用ITU-T P.862 PESQ程序,简称客观 MOS 分。

测试方法:将原始语音、重建语音输入ITU-T P.862 PESQ程序,输出数据即是客观MOS分。




2016-05-06