语音信号的“短时时域”分析

语音信号的频带范围通常是300~3400Hz，一般情况下取采样率为8kHz，本博客的部分代码采用的是已经数字化了的语音。

预加重

　　预加重的目的是为了对语音的高频部分进行加重，去除口唇辐射的影响，增加语音的高频分辨率。

　　一般通过使用一阶FIR高通数字滤波器来实现预加重，滤波器函数为：

　　$$H(z)=1-\alpha z^{-1}$$

　　其中$\alpha $为预加重系数，$0.9<\alpha<1.0$，

　　设n时刻的语音采样值为$x(n)$，经过预加重处理后的结果为$y(n)=x(n)-\alpha x(n-1)$,这里$\alpha=0.98$，

我们先来看看高通滤波器的幅频和相频响应：

clear;
[h1,f1]=freqz([1,-0.98],[1],256,4000);%高通滤波器
pha=angle(h1);           %高通滤波器的相位
H1=abs(h1);             %高通滤波器的幅值
figure(1);subplot(211);
plot(f1,H1);title('高通滤波器的幅频响应');
xlabel('频率/Hz');ylabel('幅度');
subplot(212);plot(pha);title('高通滤波器的相位响应');
xlabel('频率/Hz');ylabel('角度/radians');

View Code