【发布时间】:2019-10-22 00:35:28
【问题描述】:
我有不同长度的时间序列数据。我想根据 DTW 距离进行聚类,但找不到关于它的 ant 库。 sklearn 给出直接错误,而 tslearn kmeans 给出错误答案。
如果我用零填充它,我的问题正在解决,但我不确定在聚类时填充时间序列数据是否正确。
欢迎提出关于时间序列数据的其他聚类技术的建议。
max_length = 0
for i in train_1:
if(len(i)>max_length):
max_length = len(i)
print(max_length)
train_1 = sequence.pad_sequences(train_1, maxlen=max_length)
km3 = TimeSeriesKMeans(n_clusters = 4, metric="dtw",verbose = False,random_state = 0).fit(train_1)
print(km3.labels_)
【问题讨论】:
-
我是被问到分析问题的人,得出的结论是填充不是解决方案,因为它从超过 2 个类数据中给出了不同的答案
标签: time-series cluster-analysis k-means