【发布时间】:2019-01-08 13:28:03
【问题描述】:
早上好, 我使用 tf idf 矩阵进行 k-means 聚类,以便在歌曲文本中找到重复出现的主题。 最后我得到了4个集群。我使用以下代码进行绘图:
from sklearn.manifold import TSNE
from sklearn.decomposition import TruncatedSVD
k = 4
tfs_reduced = TruncatedSVD(n_components=k, random_state=7).fit_transform(tfidf_matrix)
tfs_embedded = TSNE(n_components=2).fit_transform(tfs_reduced)
fig = plt.figure(figsize = (10, 10))
ax = plt.axes()
plt.scatter(tfs_embedded[:, 0], tfs_embedded[:, 1], c=labels)
plt.show()
绘图似乎是正确的,但我无法添加一个图例,其中使用的每种颜色都分配给特定的集群。 我该怎么办?
【问题讨论】:
标签: python matplotlib scatter-plot tf-idf