【发布时间】:2018-03-06 03:45:12
【问题描述】:
我正在使用 PCA 将文档减少到 2 个点,以便将它们可视化。 我的方法看起来像这样。
pipeline = Pipeline([('tfidf', TfidfVectorizer())])
X = pipeline.fit_transform(sent_list).todense()
pca = PCA(n_components = 2).fit(X)
data2D = pca.fit_transform(X)
然后我使用 matplotlib 绘制它们 plt.scatter(data2D[:,0], data2D[:,1], c = label_colour)
我想添加 2 个新点并查看它们在模型中的位置。迄今为止,我在最后的训练数据中包含了初始点,并在数组的最后两个位置上绘制了一个 X,但我不确定这是否真实反映了它们的值。任何见解都会很棒。
【问题讨论】:
标签: python scikit-learn pca