【发布时间】:2020-10-21 13:52:46
【问题描述】:
我一直在处理的一些数据被重新识别了好几次。
为了有效地处理它们,我需要根据它们的ids 合并df1 和df2。
我尝试了几种基于separate()、grep()、fuzzy_join() 的方法,但由于df2 的id2 包含比df1 更长的ID,我无法处理这个问题。
下面是df1和df2的代表;
View(df1)
id1 value1
N12800 19562
N11901 403
N14688 100
N12886B 32
T00014 14
T16487 13
View(df2)
id2 value2
N11959_N11901 56
T03938_N16439_T05162_T05141_N14997 654
N12800 1234
N12886B_N12886A 75
N14688 14
T18332_T16487_T13537_T11268_T09399 61
您能否为这个“部分”ID 匹配问题提出解决方案
【问题讨论】:
标签: r string-matching partial