【问题标题】:clustering k-means are not spherical聚类 k 均值不是球形的
【发布时间】:2019-06-18 02:50:59
【问题描述】:

我是数据科学的初学者,我需要你的帮助 我正在尝试使用 K-means 测试无监督机器学习 但我发现结果不是球形的。我标准化,我删除了异常值等。 我试图找到几种方法来纠正它,但它不起作用

以下是图片: (我拿了一个数据集的小样本给你看,它实际上是 8000 行)

...

【问题讨论】:

  • 你在密谋什么? x轴和y轴是什么?请提供一段代码

标签: machine-learning k-means unsupervised-learning


【解决方案1】:
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

pca = PCA(n_components=2)

principalComponents = pca.fit_transform(df)

principalDf = pd.DataFrame(data = principalComponents, columns = ['principal component 1', 'principal component 2'])

principalDf.head(5)

我使用 PCA6 尺寸减少到 2 : 它完美地分离了数据

输出:

【讨论】:

    【解决方案2】:

    您的数据有 6 个维度。您无法以直接的方式可视化二维以上的数据,您需要使用 PCA 或 TSNE 来可视化它们。

    【讨论】:

    • 你尝试了什么?也尝试发布您的答案,因为它会帮助其他人:)
    • 我使用 PCA 将 6 维度减少到 2 ,是的,我会发布它:)
    猜你喜欢
    • 2022-08-10
    • 2019-09-25
    • 2014-07-24
    • 2015-02-09
    • 2017-12-30
    • 2013-10-25
    • 2017-01-15
    • 2012-06-18
    • 2019-10-14
    相关资源
    最近更新 更多