【发布时间】:2010-08-12 12:15:49
【问题描述】:
我有一些损坏的 html 代码,我想用正则表达式修复。
html 可能是这样的:
<p>text1</p>
<p>text2</p>
text3
<p>text4</p>
<p>text5</p>
但也可以有更多的段落和其他 html 元素。
我想变成:
<p>text1</p>
<p>text2</p>
<p>text3</p>
<p>text4</p>
<p>text5</p>
这可以用正则表达式吗?如果这很重要,我正在使用 php。
【问题讨论】:
-
重复的几乎无限的问题。正则表达式.Parse(HTML) = 失败
标签: regex html-parsing