【发布时间】:2010-09-17 05:53:13
【问题描述】:
我正在寻找一种仅匹配 Unicode 字符串中完全组成的字符的方法。
[:print:] 是否依赖于任何包含此字符类的正则表达式实现中的语言环境?例如,它会匹配日文字符“あ”,因为它不是控制字符,还是[:print:] 总是将是 ASCII 代码 0x20 到 0x7E?
是否有任何字符类(包括 Perl RE)可用于匹配控制字符以外的任何内容?如果 [:print:] 仅包含 ASCII 范围内的字符,我会假设 [:cntrl:] 也包含。
【问题讨论】:
标签: regex perl unicode locale character-properties