【发布时间】:2014-04-15 08:16:10
【问题描述】:
我有两个数据框,其中包含不同范围的时间序列数据。一个开始得早,结束得更早。此外,一个是每月一次,一个是每季度一次。但是,两者的索引都是 YYYY-MM-DD 的形式。有没有使用“Python”和“Pandas”合并这些数据帧的好方法?
谢谢!
/编辑 一组:
DATE GDP GPDI NFLS
0 1947-01-01 243.1 35.9 112.815
1 1947-04-01 246.3 34.5 111.253
2 1947-07-01 250.1 34.9 113.023
3 1947-10-01 260.3 43.2 111.440
另一个:
DATE INDPRO M08354USM310NNBR GDP
(...)
334 1946-11-01 13.3916 NaN NaN
335 1946-12-01 13.4721 NaN NaN
336 1947-01-01 13.6332 42.8 NaN
337 1947-02-01 13.7137 42.5 NaN
我想一起加入他们,这样
DATE INDPRO M08354USM310NNBR GDP GPDI NFLS
1946-11-01 13.3916 NaN NaN NaN NaN
1946-12-01 13.4712 NaN NaN NaN NaN
1947-01-01 13.6332 42.8 243.1 35.9 112.815
1947-02-01 13.7137 42.5 NaN NaN NaN
(...)
【问题讨论】:
-
您能否提供一些示例数据和您的预期输出?
-
你只是在左侧和右侧索引上进行外部合并,列名不同吗?
-
提供的例子。列名相同,外部合并听起来很有希望。
-
在最终合并的 df 中,如果一个 df 是每月一次,另一个是每季度一次,您希望日期代表什么?您可以通过按日期分组并对值求和然后重置索引来修复合并的df
-
不确定我是否理解这个问题。季度和月度日期具有相同的布局。季度数据将有 YEAR-01-01、YEAR-04-01 (...) 和月度数据有 YEAR-01-01、YEAR-02-01 (等等)。请注意,YEAR-01-01 因此对于季度和月度来说是相同的格式,并且应该包含这两种数据。这有助于澄清吗?