语音压缩编码
只针对考试内容,不全面讲解各类编码

原因:语音信号编码最简单的方式是直接将语音信号进行量化,只要量化位数足够多,就能保证解码后语音信号有很好的音质。缺点是这样所需的数码率太高,传输信道难以承受。因此必须对语音信号进行压缩编码

信源编码主要解决有效性的问题,也就是数据压缩的问题,以最少的数码表述信源所发的信号,减少容纳给定信息集合或数据采样集合的信号空间。信道编码主要解决可靠性问题,即尽量使处理过的信号在传输的过程中不出错或少出错,即使出了错也要能自动检错和尽量纠错。

原理:依据语音信号的冗余度和人的听觉感知机理。
(1)时域冗余度
1)幅度非均匀分布。小幅度样本出现的概率高
2)对于短时自相关函数,相邻样本间的相关性很强
3)浊音语音段具有准周期性
4)声道的形状及其变化缓慢
5)存在语音间隙
(2)频域冗余度
1)非均匀的长时功率谱密度高频能量较低,对应于时域上相邻样本间的相关性。
2)对于短时功率谱密度,整个谱随着频率增加而递减。整个谱形成基于基音频率的高次谐波结构。共振峰频率处能量较大。
(3)人的听觉感知机理
1)掩蔽效应。高声级单音会掩蔽临近频率声音。可用于抑制与信号同时存在的量化噪声。
2)人耳对不同频段声音的敏感程度不同。人的听觉对低频段比较敏感,对高频段不太敏感。
3)人耳对语音信号的周期性(即音调)极为敏感,而对相位变化不敏感。

上限:语音压缩编码的极限速率(下限)为80~100bps

技术
(1)线性预测
语音信号处理第七章:
短时相关性使用以下模型来描述:
语音信号处理第七章:
长时相关性使用以下模型来描述:
语音信号处理第七章:
一般来说,长时预测系数的个数在1(q=r=0)到3(q=r=1)之间
语音合成系统模型:
语音信号处理第七章:
(2)合成分析法:将综合器引入编码器,使之与分析器相结合,在编译器中生成和译码端完全一致的语音。将次合成语音与原始语音相比较,根据一定的误差原则,来调整计算各个参数,使得两者之间的误差最小。

(3)感觉加权滤波器

评价标准
理想的编码器应该是低速率、高语音质量、低时延、高误码容限、低复杂度、具有良好的健壮性和算法可扩展性。
客观评价的方法有信噪比,主观评价的方法有可懂度评价、音质评分

分类
语音信号处理第七章:

相关文章: