【问题标题】:Fastest method of MFCC extraction on linux machinelinux机器上最快的MFCC提取方法
【发布时间】:2014-01-07 18:38:38
【问题描述】:

在 linux 中从音频文件中提取 mfcc 的最快方法是什么(在我的例子中是 Raspberry Pi)。我尝试了 sphinx3,但对于大文件(在 Raspberry Pi 上)来说速度很慢。 SFS(语音归档系统)在 Windows 上相当快,但我无法在 linux 上安装它。请提出一些建议。

【问题讨论】:

    标签: signal-processing speech-recognition raspberry-pi mfcc


    【解决方案1】:

    sphinx-train 有一个应用程序可以做到这一点。我认为它工作得相当努力,我一直在旧 P4 上使用它,并没有花太长时间。不过,我没有那么多数据。

    你可以使用HCopy from HTK,虽然我没试过。

    如果您是程序员,请考虑分析sphinx-train 提取器并对其进行优化。如果你成功了,一定要让作者知道。

    最后一点:这个过程确实需要时间。这是无法避免的。尝试设置自动化脚本并让提取运行一夜。这通常是解决问题的最佳方式。

    【讨论】:

      【解决方案2】:

      尝试使用良好的优化编译器编译 sphinx-train 或 HTK,并为指令集设置正确的选项。例如,请参阅 raspberrypi.stackexchange.com/questions/2046/which-cpu-flags-are-suitable-for-gcc-on-raspberry-pi 看起来您必须使用正确的 Linux 发行版才能获得 FPU 支持(非常重要!)

      他们不使用类似 fftw 或手工编码的程序集,但他们的 FFT 等实现是高效的。

      【讨论】:

        猜你喜欢
        • 2012-04-26
        • 1970-01-01
        • 2016-08-03
        • 2011-08-04
        • 1970-01-01
        • 2016-09-24
        • 2012-06-13
        • 2018-06-25
        • 2023-01-26
        相关资源
        最近更新 更多