【发布时间】:2022-08-16 13:05:26
【问题描述】:
我有一个 pandas df,我已经将名称与 ID 匹配,但是有些 ID 没有名称。对于那些,我想返回映射文件并搜索 \'alternative_ID_list\' 列,看看是否有对应名称的匹配项。
current df
name ID
0 joe USER1
3 mary USER2
5 USER3 USER3
8 USER4 USER4
9 USER5 USER5
9 USER6 USER6
bad_matches=[3, 4, 5, 6]
mapping_df =
name ID alternative_ID_list
0 joe USER1 USER213.32
3 mary USER2 USER643.11
5 sam USER98 USER31.5
7 jack USER992 USER4.2
8 rick USER902 USER5.6, USER321.1
9 john USER979 USER6.8, USER987.9
10 jay USER980 USER479.2, USER989.0
#use mapping_df to find the bad_match_IDs (take the first match found if multiple rows for one bad_match_id)
desired
name ID
0 joe USER1
3 mary USER2
5 USER3 USER3
7 jack USER4
8 rick USER5
9 john USER6
-
输出中 rick 和 john 的 ID 是否正确?
-
是的,我想我搞砸了。我刚刚对帖子进行了编辑!感谢您的捕获!
-
答案已编辑。