【发布时间】:2020-09-15 08:51:57
【问题描述】:
这里是初学者:
我有一段文字:
例如:'hey this is a block of text, for an example, wow looks cool blah blah blah angiotensin enzyme looks cool okay.But what about angiotensin enzym well I dont know.'
还有一个单词列表:['angiotensin enzyme serum', 'some diff enzyme', 'angiotensin enzyme a1']
我的最终目标是从文本块中找到字符串匹配/模糊匹配的单词列表。
我尝试了什么:difflib.get_close_matches
需要输出:'angiotensin enzyme serum'、'angiotensin enzyme a1'
输出顺序不是问题。
对于其他文本块,列表中的其他一些字符串将匹配。块不是常量。
有没有办法做到这一点?
【问题讨论】: