【发布时间】:2019-08-29 14:32:05
【问题描述】:
【问题讨论】:
-
你能把你用肘法得到的结果贴出来吗?
-
这也取决于你想要的详细程度。您可以分析 100 个不同的集群还是更喜欢高级 4 集群分析?我认为这更多的是关于您的用例和您(或您的客户)的目标,而不仅仅是统计数据。
标签: python-3.x scikit-learn k-means
【问题讨论】:
标签: python-3.x scikit-learn k-means
如果肘法没有明确的答案,那么可能没有聚类数特别好。 k-means 只能模拟球形关系,这可能会受到限制。您也许可以尝试其他特征表示,例如基于 Word Embeddings 的东西。
对于文档分组任务,您可能希望使用主题建模方法而不是聚类,例如潜在狄利克雷分配 (LDA) 或非负矩阵分解 (NMF)。
【讨论】: