【发布时间】:2021-02-06 22:14:34
【问题描述】:
我想弄清楚这个 make_blob 函数中的 n_features 是什么。我目前正在使用 make_blob 为 Python 中的 k 均值聚类实践制作一些人工数据。
from sklearn.datasets import make_blobs
data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)
它的默认值为2,描述为特征数。但是有人可以向我解释上面显示的这个例子吗?我认为它是 200 个样本,具有 2 个特征(一个 x 和一个 y 坐标),并且有 4 个中心,聚类标准差为 1.8。
如果我们将 n_features 更改为 23 会发生什么?这个剧情有变化吗?改变它会产生影响吗,只是因为我不确定它到底做了什么。谢谢。
【问题讨论】:
标签: python scikit-learn cluster-analysis k-means