【发布时间】:2018-05-30 06:23:09
【问题描述】:
寻求有关从文本中提取关键字的帮助。我有两个数据框。第一个数据框有描述列,另一个数据框只有一列包含关键字。
我想在描述字段中从 dataframe2 中搜索关键字,并在 dataframe1 中使用匹配的关键字创建一个新列。如果有多个关键字,我需要新添加的列,其中所有关键字用逗号分隔,如下所述。
数据框2
Keywords
New
FUND
EVENT
Author
book
数据框1
ID NAME Month DESCRIPTION Keywords
12 x1 Jan funding recived fund
23 x2 Feb author of the book author, book
14 x3 Mar new year event new, event
另外,即使描述有完整的单词,我也需要关键字。即资金,我可以在新列中获得关键字资金。
【问题讨论】:
-
您可能需要
fuzzyjoin