【发布时间】:2019-10-29 16:37:54
【问题描述】:
我有两个具有不同行号和列的数据框。这两个表都有一些常见的列,包括“客户 ID”。两张表的大小分别为 11697 行 × 15 列和 385839 行 × 6 列。客户 ID 可能在第二个表中重复。我想连接两个表,并想使用客户 ID 合并相似的列。我怎么能用 python PANDAS 做到这一点。 一张桌子是这样的——
我正在使用下面的代码 -
pd.concat([df1, df2], sort=False)
只是想确保我不会丢失任何信息?如何检查是否有多个条目具有一个 ID,以及如何将其组合到一个结果中?
编辑 -
当我使用上面的代码时,这里是数据集中 NA 的值之前和之后 -
谁能告诉我哪里出错了?
【问题讨论】:
-
阅读pd.concat的文档
-
concat 主要用于将一个数据帧堆叠在另一个数据帧之上
标签: python pandas data-science data-analysis