【发布时间】:2018-05-21 07:16:48
【问题描述】:
我正在尝试构建一个语音识别应用程序。到目前为止,我已经从 10 个样本语音中提取了 mfcc 特征。每个样本产生不同的形状,如下所示:
(698, 12)
(414, 12)
(610, 12)
(586, 12)
(698, 12)
(282, 12)
(250, 12)
(370, 12)
(694, 12)
(490, 12)
我计划使用 kNN(或其他分类算法)来执行此操作,但每个样本的形状都不相同,而且它是 2D 数组而不是 1D 数组,因此我可以将其直接提供给模型。
如何以这种方式转换此数组,以便将其输入机器学习算法或如何使用二维数组构建模型?
请指教
【问题讨论】:
-
数据的第一个维度指定了什么?这是什么?
-
您的函数所需的数据类型或维度是什么?
(n, 2)的整数?已经尝试编写算法代码还是使用现有包?
标签: python arrays classification voice-recognition mfcc