【发布时间】:2020-04-08 08:04:33
【问题描述】:
我有一组使用聚类算法(在本例中为 k-means)聚类的点。我也知道真实标签,我想衡量我的聚类有多准确。我需要的是找到实际的准确性。当然,问题在于聚类给出的标签与原始标签的顺序不匹配。
有没有办法衡量这种准确性?直观的想法是计算每个标签组合的混淆矩阵的分数,并且只保留最大值。有没有这样做的功能?
我还使用 rand 分数和调整后的 rand 分数评估了我的结果。这两个指标与实际准确度有多接近?
谢谢!
【问题讨论】:
-
“混淆矩阵的分数”是什么意思?
标签: scikit-learn cluster-computing