【发布时间】:2011-08-15 16:30:05
【问题描述】:
简短: 大家好,非常简单...我只想知道从 FFT 获取 MFCC 所涉及的步骤。
详细:
大家好。我正在开发一个想要对声音进行分类的鼓应用程序。它只是一个匹配的应用程序,它返回您在鼓上演奏的音符的名称。
它是一个简单的印度响亮的大鼓。那里只有几个音符可以弹奏。
我已经实现了 fft 算法并成功获得了频谱。我现在想更进一步,从 fft 返回 mfcc。
这是我目前所理解的。 它基于对数功率谱在非线性梅尔频率标度上的线性余弦变换。
它使用三角测量来滤除频率并获得所需的系数。 http://instruct1.cit.cornell.edu/courses/ece576/FinalProjects/f2008/pae26_jsc59/pae26_jsc59/images/melfilt.png
因此,如果您从 fft 算法返回大约 1000 个值 - 声音的频谱,那么您将获得大约 12 个元素(即系数)。这个 12 元素向量用于对乐器进行分类,包括演奏的鼓...
这正是我想要的。
有人可以帮我做这样的事情吗?我的编程技能还可以。我目前正在为 iphone 创建一个应用程序。使用开放框架。
任何帮助将不胜感激。干杯
【问题讨论】:
-
一般我不愿意引用维基百科的任何技术,但this page 基本上没有给你获取系数的步骤吗?
标签: logging signal-processing fft