【发布时间】:2017-08-03 08:44:39
【问题描述】:
我目前正在尝试复制一篇论文的作品,其中他们使用 MFCC 特征训练一个 cnn,而最后没有执行 DCT。它基本上是滤波器组能量的对数。
我知道 kaldi 可以使用 make_mfcc.sh 脚本计算 MFCC 特征。但是是否可以以某种方式更改脚本以计算 MFCC 而无需在最后执行 DCT,如果不能,是否有其他工具可以做到这一点?
MFCCs 通常衍生如下:
对信号(一个窗口的摘录)进行傅里叶变换。
- 将上面获得的光谱功率映射到梅尔标度上, 使用三角形重叠窗口。
- 记录每个 mel 频率的功率日志。
- 对 mel 对数幂列表进行离散余弦变换,如 如果它是一个信号。
- MFCC 是所得频谱的幅度。
【问题讨论】:
标签: audio speech-recognition speech mfcc kaldi