提取MFCC特征的过程:

1)先对语音进行预加重、分帧和加窗;

2)对每一个短时分析窗,通过FFT得到对应的频谱;

3)将上面的频谱通过Mel滤波器组得到Mel频谱;

4)在Mel频谱上面进行倒谱分析(取对数,做逆变换,实际逆变换一般是通过DCT离散余弦变换来实现,取DCT后的第2个到第13个系数作为MFCC系数),获得Mel频率倒谱系数MFCC,这个MFCC就是这帧语音的特征;

梅尔频率倒谱系数(MFCC)

这时候,语音就可以通过一系列的倒谱向量来描述了,每个向量就是每帧的MFCC特征向量。

梅尔频率倒谱系数(MFCC)

这样就可以通过这些倒谱向量对语音分类器进行训练和识别了。

 

完整(声谱图、倒谱分析、Mel倒谱系数、MFCC提取过程):https://blog.csdn.net/wbgxx333/article/details/10020449

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-08-07
  • 2022-12-23
  • 2021-05-20
  • 2021-10-06
  • 2022-02-14
  • 2021-08-03
猜你喜欢
  • 2021-04-25
  • 2021-07-13
  • 2021-09-24
  • 2021-11-19
  • 2022-12-23
  • 2022-12-23
  • 2021-07-11
相关资源
相似解决方案