【发布时间】:2017-05-13 21:11:18
【问题描述】:
我需要在 python 中编写一个正则表达式来从推文中提取提及。
我的尝试:
regex=re.compile(r"(?<=^|(?<=[^a-zA-Z0-9-_\.]))@([A-Za-z]+[A-Za-z0-9]+)")
它适用于像@mickey 这样的任何提及 然而,在像@mickey_mouse 这样带有下划线的提及中,它只提取@mickey。
如何修改正则表达式使其在这两种情况下都能正常工作?
谢谢
【问题讨论】:
-
看起来您可以将
\w用于还包含下划线的单词字符。类似(?<![\w.-])@(\w+).