【问题标题】:manipulating MFCC file操作 MFCC 文件
【发布时间】:2012-04-11 10:15:26
【问题描述】:

我有 HTK 从 .wav 文件生成的 MFCC(梅尔频率倒谱系数)文件。我需要的是从 MFCC 中提取一个时间跨度。当 MFCC 文件代表 90 分钟长度的音频时,我想得到例如音频第三分钟的 MFCC。

HTK 的书说 MFCC 文件由一个标题和一个连续的样本序列组成。但是以字节为单位确定样本的确切大小似乎并不容易。

是否有文件解析器? (当然有,在 HTK 中,但我没有设法弄清楚如何使用二进制文件来完成这项任务。)

或者是否有一种简单的方法来确定样本和标题的大小,以便能够简单地将文件分开?

【问题讨论】:

    标签: audio signal-processing data-processing


    【解决方案1】:

    想通了。 HTK 有一个工具。 HCopy 可以将 MFCC 转换为 MFCC,并接受 start 和 end 的参数。

    HCopy -C config0 -s 10e7 -e 11e7 source.mfcc target.mfcc
    

    从源代码中删除 00:10 .. 00:11。

    config0 应该包含用于从 wav 创建原始 mfcc 的相同配置,除了 sourcekind 设置为 wav。

    【讨论】:

    • 你能告诉我配置文件中要提到的内容吗?我正在尝试使用 htk 为 mp4/wav 文件生成 mfcc
    猜你喜欢
    • 1970-01-01
    • 2011-01-23
    • 2012-05-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多