【发布时间】:2017-12-27 22:21:10
【问题描述】:
我想拆分一个如下所示的字符串:
This is <strong>a</strong> test <a href="#test">link</a> and <br /> line. break
使用 JavaScript 进入以下内容:
[
'This',
'is',
'<strong>a</strong>',
'test',
'<a href="#test">link</a>',
'<br />',
'line.',
]
我尝试在空格和< > 上进行拆分,但这显然不适用于strong 和a 之类的标签。我不确定如何编写一个不在 HTML 标记中拆分的正则表达式。我也尝试使用 jQuery children(),但它不提取纯文本,只提取 html 标签。任何帮助都会很棒。
【问题讨论】:
-
这比看起来更复杂。解析 HTML 很困难。
-
这不就是
str.split(" ");吗? -
没有一个简单的 reg exp 可以做到这一点......
-
@eLRuLL 这会将 br 放在两个索引上
-
我无法想象你会这样做的原因,但如果它是为了某种用户输入(cmets、论坛帖子等),创建你的会更容易(也更安全)自己的降价风格,而不是深入研究标记化 HTML 的领域。
标签: javascript html regex