【发布时间】:2018-12-22 20:28:10
【问题描述】:
所以我对机器学习还很陌生,我正在尝试创建一个 python 脚本来分析计算机的能量数据集。 该脚本最终应确定计算机的不同状态(如空闲、待机、工作等)以及这些状态平均使用多少能量。
我想知道这个任务是否可以通过一些聚类方法来完成,比如 k-means 或 DBSCAN。
我对 scikit learn 中的一些聚类方法进行了一些修改,但到目前为止的结果并没有我预期的那么好。 我对聚类方法进行了很多研究,但我始终找不到与我相似的场景。
所以我的问题是它是否值得麻烦,如果是的话,哪种聚类方法(或整体机器学习算法)最适合该任务?还是有更好的方法?
能源数据集只是一个单列表,其中一个单元格代表几天内每秒一个能源值。
【问题讨论】:
-
我会在这个表格中说,问题太宽泛了,你可以尝试从你的数据集中分享一些示例数据,添加你的格式良好的代码来显示问题。
-
好吧,我的代码没有问题。问题更多的是哪种聚类方法最好(如果有适合我的目的)。
-
@BrandonH。如果你能给我们你的时间序列图会有所帮助 - 你已经有了一些答案,但这至少会让我们对数据有所了解。
标签: python machine-learning scikit-learn cluster-analysis