【发布时间】:2021-11-28 05:49:00
【问题描述】:
我正在使用 HDBSCAN,我只想绘制一个数据集群。
这是我当前的代码:
import hdbscan
import pandas as pd
from sklearn.datasets import make_blobs
blobs, labels = make_blobs(n_samples=2000, n_features=10)
clusterer = hdbscan.HDBSCAN(min_cluster_size=15).fit(blobs)
color_palette = sns.color_palette('deep', 8)
cluster_colors = [color_palette[x] if x >= 0
else (0.5, 0.5, 0.5)
for x in clusterer.labels_]
cluster_member_colors = [sns.desaturate(x, p) for x, p in
zip(cluster_colors, clusterer.probabilities_)]
plt.scatter(blobs[:, 2], blobs[:, 5], s=50, linewidth=0, c=cluster_member_colors, alpha=0.25)
plt.show()
我知道数据有 3 个聚类,但我怎样才能只绘制其中一个?
如果我有一个聚类点,如何知道 pandas 数据框的哪一列对应于该点?
【问题讨论】:
标签: python pandas cluster-analysis hdbscan