【问题标题】:How to add emojis to alphanumerics RegEx in Python如何在 Python 中将表情符号添加到字母数字 RegEx
【发布时间】:2021-02-04 04:41:17
【问题描述】:

如何将所有表情符号添加到 RegEx 中的字母数字中,像这样

pattern = r'\w+'

【问题讨论】:

标签: python regex emoji


【解决方案1】:

您可以使用emoji 包(pip install emoji) 来获取表情符号集并将其与\w+ 组合成这样:(?:\w|<emoji_pattern>)+:

from emoji import UNICODE_EMOJI
import re

e_list = UNICODE_EMOJI.keys()
word_emoji_rx = re.compile(r"(?:\w|{})+".format("|".join(map(re.escape, sorted(e_list,key=len,reverse=True)))))
print(word_emoji_rx.findall(r'?abc def gh?i'))
# => ['?abc', 'def', 'gh?i']

查看Python demo

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-12-23
    • 2020-04-08
    • 1970-01-01
    • 1970-01-01
    • 2021-10-31
    • 2012-05-02
    • 1970-01-01
    • 2018-12-13
    相关资源
    最近更新 更多