【发布时间】:2018-01-14 18:50:21
【问题描述】:
我想使用 scikit-learn 的 svm.SVC() 估计器对多维时间序列执行分类任务——即在序列中的点取 R^d 值的时间序列上,其中 d > 1。
这样做的问题是svm.SVC() 最多只能采用维度为 2 的 ndarray 对象,而此类数据集的维度为 3。具体而言,给定数据集的形状将是 (n_samples, n_features, d) .
是否有可用的解决方法?一个简单的解决方案是重塑数据集,使其成为二维的,但是我想这会导致分类器无法正确地从数据集中学习。
【问题讨论】:
-
n_features维度是什么?您在第一段中描述的时间序列的形状为(n_samples, d)。除此之外,重塑可能会奏效。你为什么不试试呢? -
n_features是及时记录的数量 - 例如,如果我每分钟记录屏幕上光标的位置 1 小时,那么n_features将是 60,@987654329 @ 将是 3。关于第二点:我想知道是否有更好的解决方案(我还没有看到任何地方讨论过这个问题)。 -
我认为
samples是时间位置...那么n_samples维度是什么?不同的路径实现? -
n_samples是不同系列的数量:如果我们对图像进行分类,它将是我们数据集中的图像数量。
标签: scikit-learn time-series svm