【问题标题】:RegEx to test if a string contains more than X Unicode words正则表达式来测试一个字符串是否包含超过 X 个 Unicode 单词
【发布时间】:2014-03-26 09:14:02
【问题描述】:

我看到了许多匹配拉丁字符的解决方案,例如:/^\W*(\w+\b\W*){80,}$/ 我正在寻找支持任何带有 Unicode 字符的语言的等效表达式。

RegEx 需要与 JavaScript 兼容。

【问题讨论】:

标签: javascript regex


【解决方案1】:

编辑: 遗憾的是,Javascript 似乎不支持此解决方案...您可能需要查看 XRegEx

我将把它留在这里,以防它对其他语言更兼容 Perl 的人有用,但这并不能回答您的问题,抱歉。


对于 unicode 支持,您可以使用 \p{...} pattern

你的模式会变成

/^\P{L}*(\p{L}+\P{L}*){80,}$/

这里\P{L} 代表除字母以外的任何东西,\p{L} 代表任何字母(但不是数字或_,所以它与\w 有点不同)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多