【发布时间】:2014-02-09 11:52:41
【问题描述】:
我有 2 个数据帧 df1 和 df2 具有相同的列名 ['a','b','c'] 并按日期索引。 日期索引可以具有相似的值。 我想创建一个 DataFrame df3,其中仅包含 ['c'] 列中的数据,分别重命名为 'df1' 和 'df2' 并具有正确的日期索引。我的问题是我无法正确合并索引。
df1 = pd.DataFrame(np.random.randn(5,3), index=pd.date_range('01/02/2014',periods=5,freq='D'), columns=['a','b','c'] )
df2 = pd.DataFrame(np.random.randn(8,3), index=pd.date_range('01/01/2014',periods=8,freq='D'), columns=['a','b','c'] )
df1
a b c
2014-01-02 0.580550 0.480814 1.135899
2014-01-03 -1.961033 0.546013 1.093204
2014-01-04 2.063441 -0.627297 2.035373
2014-01-05 0.319570 0.058588 0.350060
2014-01-06 1.318068 -0.802209 -0.939962
df2
a b c
2014-01-01 0.772482 0.899337 0.808630
2014-01-02 0.518431 -1.582113 0.323425
2014-01-03 0.112109 1.056705 -1.355067
2014-01-04 0.767257 -2.311014 0.340701
2014-01-05 0.794281 -1.954858 0.200922
2014-01-06 0.156088 0.718658 -1.030077
2014-01-07 1.621059 0.106656 -0.472080
2014-01-08 -2.061138 -2.023157 0.257151
df3 DataFrame 应具有以下形式:
df3
df1 df2
2014-01-01 NaN 0.808630
2014-01-02 1.135899 0.323425
2014-01-03 1.093204 -1.355067
2014-01-04 2.035373 0.340701
2014-01-05 0.350060 0.200922
2014-01-06 -0.939962 -1.030077
2014-01-07 NaN -0.472080
2014-01-08 NaN 0.257151
但在 df1 列中使用 NaN,因为 df2 的日期索引更宽。 (在这个例子中,我会得到以下日期的 NaN:2014-01-01, 2014-01-07 and 2014-01-08)
感谢您的帮助。
【问题讨论】: