【问题标题】:Fastest method of MFCC extraction on linux machinelinux机器上最快的MFCC提取方法
【发布时间】:2014-01-07 18:38:38
【问题描述】:
在 linux 中从音频文件中提取 mfcc 的最快方法是什么(在我的例子中是 Raspberry Pi)。我尝试了 sphinx3,但对于大文件(在 Raspberry Pi 上)来说速度很慢。 SFS(语音归档系统)在 Windows 上相当快,但我无法在 linux 上安装它。请提出一些建议。
【问题讨论】:
标签:
signal-processing
speech-recognition
raspberry-pi
mfcc
【解决方案1】:
sphinx-train 有一个应用程序可以做到这一点。我认为它工作得相当努力,我一直在旧 P4 上使用它,并没有花太长时间。不过,我没有那么多数据。
你可以使用HCopy from HTK,虽然我没试过。
如果您是程序员,请考虑分析sphinx-train 提取器并对其进行优化。如果你成功了,一定要让作者知道。
最后一点:这个过程确实需要时间。这是无法避免的。尝试设置自动化脚本并让提取运行一夜。这通常是解决问题的最佳方式。
【解决方案2】:
尝试使用良好的优化编译器编译 sphinx-train 或 HTK,并为指令集设置正确的选项。例如,请参阅 raspberrypi.stackexchange.com/questions/2046/which-cpu-flags-are-suitable-for-gcc-on-raspberry-pi 看起来您必须使用正确的 Linux 发行版才能获得 FPU 支持(非常重要!)
他们不使用类似 fftw 或手工编码的程序集,但他们的 FFT 等实现是高效的。