【发布时间】:2017-12-03 02:29:19
【问题描述】:
考虑到我有一个字符串:
text = "You are good at data mining and machine learning"
还有一个可能的二元组列表:
bigrams = ["data mining", "machine learning"]
我如何检测文本中的那些二元组并将两个单词合并在一起,这样我的结果将是一个字符串,如:
new_text = "You are good at data_mining and machine_learning"
我需要将其应用于更大的字符串(语料库)和更长的二元组列表。
我用 string.replace() 试过了:
new_text = [x.replace(" ","_") for x in text if x in bigrams]
但这会导致一个空列表。
【问题讨论】:
-
不是我认为最高效的,但
for bigram in bigrams: text = text.replace(bigram,bigram.replace(' ','_'))
标签: python string list substring