【问题标题】:how to find k value for k-means?如何找到k-means的k值?
【发布时间】:2019-08-29 14:32:05
【问题描述】:

我在包含多个 150k 文档的数据集上使用 k-means,但我不知道什么是好的 k 值。 我试过肘法找到它,但惯性值变化不大。(我正在使用sklearn)。

这里是

【问题讨论】:

  • 你能把你用肘法得到的结果贴出来吗?
  • 这也取决于你想要的详细程度。您可以分析 100 个不同的集群还是更喜欢高级 4 集群分析?我认为这更多的是关于您的用例和您(或您的客户)的目标,而不仅仅是统计数据。

标签: python-3.x scikit-learn k-means


【解决方案1】:

如果肘法没有明确的答案,那么可能没有聚类数特别好。 k-means 只能模拟球形关系,这可能会受到限制。您也许可以尝试其他特征表示,例如基于 Word Embeddings 的东西。

对于文档分组任务,您可能希望使用主题建模方法而不是聚类,例如潜在狄利克雷分配 (LDA) 或非负矩阵分解 (NMF)。

【讨论】:

    猜你喜欢
    • 2012-04-13
    • 2017-11-23
    • 2012-07-06
    • 2019-05-04
    • 1970-01-01
    • 2016-02-04
    • 2013-07-03
    • 2020-03-03
    相关资源
    最近更新 更多