【发布时间】:2012-06-02 11:47:40
【问题描述】:
我需要从字符串中删除所有非字母和标记(Unicode 类别)字符。目前我正在拆分并随后加入这样的字符串:
text.split("[\\p{P} \\t\\n\\r]")
然而,我的正则表达式...严重不足。请帮忙。
编辑 我认为这会奏效:
text.split("[\\P{M}\\P{L}]")
【问题讨论】:
-
我不是 PCRE 中的 Java 用户 \X 应该匹配 all unicode characters。