【发布时间】:2015-04-29 14:06:59
【问题描述】:
这是我的数据农场“df”:
match name group
adamant Adamant Home Network 86
adamant ADAMANT, Ltd. 86
adamant bild TOV Adamant-Bild 86
360works 360WORKS 94
360works 360works.com 94
每个组号我想一一比较名称,看看它们是否与“匹配”列中的同一个词匹配。
所以期望的输出将是计数:
If they match we count it as 'TP' and if not we count it as 'FN'.
我有一个想法,计算每个组数的匹配词数,但这对我想要的完全没有帮助:
df.groupby(group).count()
有没有人知道怎么做?
【问题讨论】:
-
你能发布想要的输出吗,谢谢
-
@EdChum 我编辑了这个问题。谢谢
-
您能否解释一下您认为匹配的内容,您是否只是检查“名称”中是否存在“匹配”中的单词?
-
@EdChum 匹配意味着当我们成对比较来自相同组号的单词时,它们的“匹配”列中有相同的单词
标签: python pandas group-by comparison