【发布时间】:2014-06-07 20:12:00
【问题描述】:
我的带有梵文单词的 HTML 代码
<html>
<head>
<title>TODO</title>
<meta charset="UTF-8">
</head>
<body>
मंत्री मुख्यमंत्री
</body>
<script src="jquery-1.11.0.min.js"></script>
<script src="xregexp_20.js"></script>
<script src="addons/unicode/unicode-base.js"></script>
<script src="addons/unicode/unicode-scripts.js"></script>
<script src="my.js"></script>
</html>
我的 JavaScript 代码
var html = document.getElementsByTagName("html")[0];
var fullpage_content = html.innerHTML;
var regex = RegExp("मंत्री", "g");
var count = fullpage_content.match(regex);
console.log("count in page : " + count+ ", " + count.length);
//use of word boundry ,not supported by devanagari characters
regex = RegExp("\\bमंत्री\\b", "g");
count = fullpage_content.match(regex);
console.log("count in page : " + count);
regex = XRegExp("मंत्री");
var match = XRegExp.matchChain(fullpage_content, [regex]);
console.log("count in page : " + match + ", " + match.length);
//xregex do not support word boundry \\b
regex = XRegExp("\\bमंत्री\\b");
match = XRegExp.matchChain(fullpage_content, [regex]);
console.log("count in page : " + match + ", " + match.length);
js 的输出(在 Chrome 上)
页数:मंत्री,मंत्री, 2
页数:null
页数:मंत्री,मंत्री, 2
页数: , 0
整个单词搜索应该给出一个答案,但是 regexp 和 XRegExp 都让我失望了。我需要一些帮助。
【问题讨论】:
-
你能给我们这个小提琴吗?
-
@PrabhatJain 我为我创建了一个。你可以看看jsfiddle.net/es63p
-
如果有帮助,请检查一下你的小提琴。
-
这里是更新的小提琴。 jsfiddle.net/es63p/3 BTW 我想问这个问题的人想使用 xregexp 库。该脚本未返回实际字数。
标签: javascript regex unicode hindi xregexp