【发布时间】:2015-05-23 16:45:15
【问题描述】:
如何使用 NodeJS 仅获取 HTML 标签?
我有这个:
<html>
<head>
Hi
</head>
<body>
<center id="fantastic">
Hi , hello
</center>
</body>
</html>
我想删除 Hi 和 Hi , Hello 并只获取标签,我也想删除 id="fantastic"。 任何的想法?有正则表达式吗?
【问题讨论】:
-
str.replace(/>([\w\W]+?)</g,"><");将适用于有效标记 -
@vihan1086 - 为什么在原始问题中不存在任何内容时更改源 HTML 以添加缩进。这是一个关于解析和修改某些特定 HTML 源的问题,因此更改 OP 提供的输入似乎不合适。
-
var ok = result.replace(/>([\w\W]+?)</g,"><"); ok= ok.replace(/ ([\w\W]+?) >/g,">"); ok= ok.replace(/ ([\w\W]+?)>/g,">");我做了这个,但我不喜欢也不知道是否适用于所有事情。有什么改进的办法吗?
标签: javascript html node.js parsing tags