【发布时间】:2017-06-18 07:09:17
【问题描述】:
我有一个具有 DateTime 索引的数据集,我正在使用 sklearn 中的 PCA 来减少维数。
以下问题困扰着我 - PCA 会保持我系列中点的顺序,以便我可以重用原始数据帧中的索引吗?
df = pd.DataFrame(...)
df2 = pca.fit_transform(df)
df2.index = df.index
此外,有没有比这样做更好(更安全)的方法?
【问题讨论】:
-
也许重新索引会有所帮助 -
pca.fit_transform(df).reindex(index=df.index)? -
我在做什么有什么不同吗?
-
不太可能。这将摆脱不必要的索引轴重新分配。
标签: pandas scikit-learn