【发布时间】:2014-03-07 23:45:15
【问题描述】:
我的正则表达式用于查找文本中的某些单词,而不是元素文本中的单词。
正则表达式
RegExp('\\b([^<(.*?)>(.?+)<\/(.*?)>])(' + wregex.join('|') + ')\\b(?=\\W)
示例
This is some text that should be looked through
though this text <code>Should not be looked at </code> and this text is ok to
look at
所以我将解释我遇到问题的正则表达式的方法
([^<(.*?)>(.?+)<\/(.*?)>]) 不匹配以<element> 开头的任何文本,直到</element>
这是最重要的,所以我尝试了多种方法,但不确定这个正则表达式是否可行。我不想匹配以基本 html 元素标记开头的任何内容,直到出现结束标记然后重新开始搜索。
编辑 我知道 RegEx 不应该用于解析 HTML 这是通过 TEXT
测试示例HERE
【问题讨论】:
-
我必须发布这个,因为它的相关性(再次):请参阅here,了解为什么使用正则表达式解析 HTML 不好。
-
它们都是不同的变量名。 tregex wregex iregex 或类似的东西。 Xynariz 我知道我在文本上使用它。
标签: javascript regex