【发布时间】:2021-02-16 15:36:22
【问题描述】:
我有一个数据框列,其中包含文章名称(名称:文章)。我希望创建另一个列来扫描文章列的每个元素,并从列表中找到以下任何关键字:
['What','Why','How', 'Who', 'COVID-19', 'COVID', 'When','Where','?']
问题是“?”的存在返回一个错误:在位置 32 没有可重复的内容。我尝试将 regex=False 传递给我的代码仍然看到同样的问题
mylist = ['What','Why','How', 'Who', 'COVID-19', 'COVID', 'When','Where','?']
pattern = '|'.join(mylist)
df1_pcp['Boolean flag'] = df1_pcp.Title.str.contains(pattern)
我应该如何解决这个问题?
【问题讨论】:
-
'?'是一个特殊的正则表达式字符,考虑用'\?'替换它吗?