【发布时间】:2021-02-04 04:41:17
【问题描述】:
如何将所有表情符号添加到 RegEx 中的字母数字中,像这样
pattern = r'\w+'
【问题讨论】:
如何将所有表情符号添加到 RegEx 中的字母数字中,像这样
pattern = r'\w+'
【问题讨论】:
您可以使用emoji 包(pip install emoji) 来获取表情符号集并将其与\w+ 组合成这样:(?:\w|<emoji_pattern>)+:
from emoji import UNICODE_EMOJI
import re
e_list = UNICODE_EMOJI.keys()
word_emoji_rx = re.compile(r"(?:\w|{})+".format("|".join(map(re.escape, sorted(e_list,key=len,reverse=True)))))
print(word_emoji_rx.findall(r'?abc def gh?i'))
# => ['?abc', 'def', 'gh?i']
【讨论】: