【发布时间】:2012-04-30 05:36:48
【问题描述】:
我有一些这样的链接:
<a href="http://illegallink.com"><img src="something.jpg" /><a href="http://legallink.com">legal</a></a>
我想删除所有没有包含“legallink.com”的链接。但仍然保留内容。所以上面的输入会输出:
<img src="something.jpg" /><a href="http://legallink.com">legal</a>
它应该通过链接递归地工作。
我发现这个删除所有链接的正则表达式:/<\\/?a(\\s+.*?>|>)/,但我希望它保留 href 为 legallink.com 的链接。
这可以用正则表达式完成吗?还是应该使用 DOM 解析器?
【问题讨论】:
-
需要一个 DOM 解析器,尤其是对于嵌套的 标记,如您的示例。
-
谁能举例说明我如何实现我想要的?我看了很多,但找不到解决方案。