【发布时间】:2013-02-17 20:06:58
【问题描述】:
我正在尝试使用 re 模块验证名称字段。
\w 不匹配非 ascii 字符,例如 à。
似乎在许多其他正则表达式引擎中,解决方案应该是\p{L},但它似乎在 python 中不受支持。什么是合适的等价物?
更新:
这与围绕该主题的其他问题不同,因为我正在寻找 \w 的 unicode 替代品,这不是使用默认 re.UNICODE 标志获得的那个(因为这个标志也使 \w匹配数字和下划线)。
【问题讨论】:
-
是的,每个
re.<function>都有一个flags参数。 -
请参阅stackoverflow.com/questions/238223/… 了解类似(重复?)问题。
-
@BrenBarn 我试过 re.UNICODE 但它不适合,因为它也匹配数字和下划线
-
@GJ.:您的更新:指示的重复状态“我还需要一个 不匹配数字的正则表达式。”那么下划线处理是唯一的区别吗?
标签: python regex validation unicode non-ascii-characters