【发布时间】:2018-05-28 21:00:26
【问题描述】:
所以我有这些 CSV 文件,我想组合如下:
file1.csv
Date,Time,Unique1,Common
blah,blah,55,92
file2.csv
Date,Time,Unique2,Common
blah,blah,12,25
我想要一个 pandas 数据框...
Date,Time,Unique1,Unique2,Common (order of columns doesn't matter)
blah,blah,55,12,117
.. 其中 92+25 是 117。
我发现了一篇与这篇文章标题完全相同的帖子,其中包含以下代码示例:
each_df = (pd.read_csv(f) for f in all_files)
full_df = pd.concat(each_df).groupby(level=0).sum()
这可以满足我的需要,只是它不继承日期和时间列。我想那是因为 sum() 不知道如何处理它。
我反而得到...
Unique1,Unique2,Common
<values as expected>
请帮助我通过日期和时间列。 它们应该在每个文件中完全相同,所以我可以按“日期”和“时间”列索引数据。
提前致谢。
【问题讨论】:
-
你把
blah,blah放在这里。但是日期和时间列是您要加入的索引吗? -
嗨,马特,是的,这些是我想要索引的列。
标签: python pandas join merge concat