【发布时间】:2019-10-28 09:36:04
【问题描述】:
我正在尝试从 csv 更新 Excel 工作表中的一些数据。加载数据后,我尝试查看是否存在 ID,如果不存在,请将其附加到数据框中,例如:
df:
0 1 2 3
0 1 2 3 4
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
df2:
0 1 2
0 5 6 7
1 2 3 4
结果:
0 1 2 3
0 1 2 3 4
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
4 5 6 7 NaN
我已尝试仅附加行 df.append(df2)。我确信一个简单的解决方法是添加一个值以将 NaN 替换为 0,但我正在处理更大规模的数据集,因此如果有的话,我需要找到更好的方法。
ValueError: 数组太大; arr.size * arr.dtype.itemsize 大于最大可能大小。
【问题讨论】:
-
dataframes,索引供参考,我要匹配的列是第1列,然后附加到数据帧
-
你试过了吗:
pd.concat([df1, df2])默认会放NaN。 -
刚刚试了一下,确实有效!谢谢!我对使用 append 非常执着,我什至没有看 concat。