【发布时间】:2013-05-08 22:21:20
【问题描述】:
这可能是一个非常愚蠢的问题,但我在任何地方都找不到详细信息。
所以我有一个 3 秒长的录音(wav 文件)。那是我的样本,需要分类为 [class_A] 或 [class_B]。
通过遵循一些关于 MFCC 的教程,我将样本分成几帧(准确地说是 291 帧),并且我从每一帧中得到了 MFCC。
现在我有291个特征向量,每个向量的长度是13。
我的问题是;您如何将这些向量与分类器(例如 k-NN)一起使用?我有 291 个向量代表 1 个样本。我知道如何为 1 个样本使用 1 个向量,但如果我有 291 个样本,我不知道该怎么做。我真的找不到任何解释。
【问题讨论】:
-
你能提供你如何解决它的链接吗?
-
能否请您发布您的解决方案
标签: audio classification knn mfcc