【发布时间】:2021-01-29 23:38:00
【问题描述】:
请帮助我如何进行以下操作。 我认为这是我目前需要在 pandas 中做的最特别的事情。
基本上我需要合并 2 个数据帧,其中在 df1 我有一个部分字符串(address_id),在数据帧 2 中我有相同的信息,但与另一个(concat_address_id)连接。
我尝试了几种方法来合并、提取字符串、预处理字符串、检查包含部分字符串匹配的列表。但是,没有找到一种聪明的方法来做我需要的事情,如下面的示例所示,即基于子字符串匹配合并数据帧。
这是 df1:
process sku qty address_id customer country
process1 sku1 1 address1 customer5 BR
process1 sku2 1 address2 customer5 BR
process1 sku3 1 address3 customer5 BR
process1 sku4 1 address4 customer5 BR
process1 sku5 1 address5 customer5 BR
这是 df2。
concat_address_id last_login country_of_login
address1address5 15/10/2020 CN
address6address2 18/02/2020 NL
address3address5 13/05/2019 BR
address6address4 18/06/2020 NL
address5address8 13/05/2019 RU
这是预期的结果。
预期结果:
process sku qty address_id customer country last_login country_of_login
process1 sku1 1 address1 customer5 BR 15/10/2020 CN
process1 sku2 1 address2 customer5 BR 18/02/2020 NL
process1 sku3 1 address3 customer5 BR 13/05/2019 BR
process1 sku4 1 address4 customer5 BR 18/06/2020 NL
process1 sku5 1 address5 customer5 BR 13/05/2019 RU
【问题讨论】:
-
我想你可以看看这个答案stackoverflow.com/questions/54756025/…