【发布时间】:2014-11-24 12:59:03
【问题描述】:
我正在尝试开发一个语音/声音识别程序,该程序可以提取一些有用的数据,例如有关声音的数据。例如..基频/ MFCC / Centroid等。 语音通常以 20 到 30 ms 的帧进行分割,窗口分析是 偏移 10 毫秒。
我想找到一个补丁/对象或一些有用的建议,说明如何使用框架、移位、我更喜欢的声音分析分割步骤来实现窗口分割。
有人知道怎么做吗?
【问题讨论】:
标签: speech-recognition speech max-msp-jitter