K 表示 Python 中的聚类 - 使用 make_blob答案

【问题标题】：K Means Clustering in Python - Using make_blobsK 表示 Python 中的聚类 - 使用 make_blob
【发布时间】：2021-02-06 22:14:34
【问题描述】：

我想弄清楚这个 make_blob 函数中的 n_features 是什么。我目前正在使用 make_blob 为 Python 中的 k 均值聚类实践制作一些人工数据。

from sklearn.datasets import make_blobs
data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)

它的默认值为2，描述为特征数。但是有人可以向我解释上面显示的这个例子吗？我认为它是 200 个样本，具有 2 个特征（一个 x 和一个 y 坐标），并且有 4 个中心，聚类标准差为 1.8。

如果我们将 n_features 更改为 23 会发生什么？这个剧情有变化吗？改变它会产生影响吗，只是因为我不确定它到底做了什么。谢谢。

【问题讨论】：

【解决方案1】：

如果你只从函数中解包单个值，就像你在这里做的那样：

data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)

数据将是形状 [n_samples, n_features] 的数组。所以基本上当你改变它时到 23 你会得到形状为 [n_samples, 23] 的数组。你可以想到这个生成样本作为多维平面中的坐标。

【讨论】：