【发布时间】:2015-01-17 09:57:35
【问题描述】:
假设有两个数据框,每个都有一个日期时间索引,每个都有一列未命名的数据。数据帧的长度不同,日期时间索引可能重叠也可能不重叠。
df1 长度为 20。df2 长度为 400。数据列由随机浮点数组成。
我想通过 df2 进行迭代,每次迭代需要 20 个单位,每次迭代将起始向量增加一个单位 - 类似地,结束向量增加一个单位。在每次迭代中,我想计算 df1 的 20 个单位和我为 df2 的这次迭代选择的 20 个单位之间的相关性。然后将记录该相关系数和其他统计数据。
一旦循环完成,我想用 df2 的 20 单位向量绘制 df1,满足我的统计搜索 - 因此需要跟上某种程度的索引,以便在分析完成后重新获取向量。
有什么想法吗?
【问题讨论】:
标签: python pandas correlation