【问题标题】:K Means Clustering in Python - Using make_blobsK 表示 Python 中的聚类 - 使用 make_blob
【发布时间】:2021-02-06 22:14:34
【问题描述】:

我想弄清楚这个 make_blob 函数中的 n_features 是什么。我目前正在使用 make_blob 为 Python 中的 k 均值聚类实践制作一些人工数据。

from sklearn.datasets import make_blobs
data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)

它的默认值为2,描述为特征数。但是有人可以向我解释上面显示的这个例子吗?我认为它是 200 个样本,具有 2 个特征(一个 x 和一个 y 坐标),并且有 4 个中心,聚类标准差为 1.8。

如果我们将 n_features 更改为 23 会发生什么?这个剧情有变化吗?改变它会产生影响吗,只是因为我不确定它到底做了什么。谢谢。

【问题讨论】:

    标签: python scikit-learn cluster-analysis k-means


    【解决方案1】:

    如果你只从函数中解包单个值,就像你在这里做的那样:

    data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)
    

    数据将是形状 [n_samples, n_features] 的数组。所以基本上当你改变它时 到 23 你会得到形状为 [n_samples, 23] 的数组。你可以想到这个 生成样本作为多维平面中的坐标。

    【讨论】:

      猜你喜欢
      • 2016-08-12
      • 2016-10-25
      • 1970-01-01
      • 1970-01-01
      • 2016-10-13
      • 2013-08-29
      • 2016-09-06
      • 2012-01-06
      相关资源
      最近更新 更多