【发布时间】:2020-11-01 09:24:28
【问题描述】:
Notepad++ 提供了许多在正则表达式中使用时似乎与 Unicode 等效项匹配的类名。例如,Notepad++ 中的 \p{upper} 对应于许多其他正则表达式风格中的 \p{Lu}。是否可以在 Notepad++ 中指定更受限制的 Unicode 类别,例如 \p{Pd} = "punctuation dash" 的等效项(\p{punct} 包含太多)?
【问题讨论】:
Notepad++ 提供了许多在正则表达式中使用时似乎与 Unicode 等效项匹配的类名。例如,Notepad++ 中的 \p{upper} 对应于许多其他正则表达式风格中的 \p{Lu}。是否可以在 Notepad++ 中指定更受限制的 Unicode 类别,例如 \p{Pd} = "punctuation dash" 的等效项(\p{punct} 包含太多)?
【问题讨论】:
至少暂时没有办法。
使用替代方法:
[\xAD\x2D\u058A\u05BE\u1400\u1806\u2010-\u2015\u2E17\u2E1A\u2E3A\u2E3B\u2E40\u301C\u3030\u30A0\uFE31\uFE32\uFE58\uFE63\uFF0D]
它匹配所有 \p{Pd} + 不属于 \p{Pd} 的软连字符 (\xAD)。
【讨论】: