【发布时间】:2014-06-25 08:19:15
【问题描述】:
我似乎无法解决这个看似简单的问题。
假设 tr 内永远不会嵌套 tr(因此不需要成熟的解析器)。
var HTMLtoParse = 'anything before <tr>1 blah<td></td>gsdgfs</tr> dfg <tr>2 blah<td></td>sdgfs</tr> anything after ';
var magicRE = /????/g;
var desiredOutput = HTMLtoParse.match(magicRE);
期望输出在哪里
[
'<tr>1 blah<td></td>gsdgfs</tr>',
'<tr>2 blah<td></td>sdgfs</tr>'
]
提前干杯
【问题讨论】:
-
抱歉,这不是重复的吗?阅读问题
-
尽管您在谷歌上搜索“使用正则表达式解析 html”时看到了数十条警告(以及对假定重复的最终答案),但您仍然认为这是一个好主意吗?
-
@RobertHarvey 所有警告都告诉您正则表达式由于嵌套而不能很好地与 html 一起使用,并且它们都建议使用递归的体面解析器。但是由于 TR 中永远不会有 TR,所以没有问题。
标签: javascript html regex node.js