【问题标题】:Regular expressions with Indian characters带有印度字符的正则表达式
【发布时间】:2013-01-29 09:03:09
【问题描述】:

我想知道是否可以为印度字符编写正则表达式?我想验证给定的字符是否是印度字母或数字。我发现了这两个问题:

What are the unicode ranges for Hindi accented characters?

what is the range for Hindu–Arabic (ARABIC-INDIC) numeral utf8 from 0 to 9

所以我尝试了这个:\x{0600}-\x{06ff}

但如果我搜索此文本(在 OpenOffice 中):http://pastebin.com/mDHL69XH 使用此:\x{0600}-\x{06ff} 什么都没找到……

【问题讨论】:

  • 不同的正则表达式引擎是不同的。您说您“想要验证给定字符是否是印度字母或数字”,这表明您正在使用某种编程语言,但随后您说您“搜索此文本(在 OpenOffice 中)”,这表明您正在尝试使用 不同的 正则表达式引擎测试您的正则表达式。这是个坏主意。
  • 你应该指定你正在使用的语言
  • 我从来没有真正深入研究过正则表达式......所以不同的引擎对我来说是新的 :) 好吧,我实际上是在尝试在 javascript 中做到这一点......

标签: javascript regex character hindi


【解决方案1】:

这个应该可以

[\u0900-\u097F]+// \uFFFF format supported by Java,.net

[\u{0900}-\u{097F}]+// \u{FFFF} format supported by perl,pcre

\p{Devanagari}//not widely supported

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-11-20
    • 2011-02-20
    • 2019-01-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-09-28
    相关资源
    最近更新 更多