【发布时间】:2020-01-10 19:07:06
【问题描述】:
我有以下数据框:
StockId Date Value
1 2015-01-02 -0.070012
2 2015-01-02 -0.022447
4 2015-01-02 -0.011474
6 2015-01-02 0.003796
13 2015-01-02 -0.032061
...
355 2018-09-14 -0.035717
356 2018-09-14 -0.007899
357 2018-09-14 0.065217
358 2018-09-14 0.063536
359 2018-09-14 -0.023433
我正在寻找随着时间的推移股票之间的相关性,以便找到与股票 1 最相关的五只股票。有没有使用 pandas 的快速方法来做到这一点?或者这是否需要创建数组然后一一计算相关性?数据框中有 359 只股票。
【问题讨论】:
-
您的前几行是否缺少一列?数据框似乎从 3 列跳到 4 列。如果是这样,您能否更新列标题。另外,您的数据框的形状是什么?
-
道歉 - 没有遗漏列,我只是省略了索引。形状约为 2555 x 3。
标签: python pandas correlation