【发布时间】:2011-03-07 18:57:45
【问题描述】:
我的情况是,我的 HTML 标记带有一些外部文本(前导或尾随)。我应该使用什么正则表达式?例如:
some text over here
<Html>
<Title>website</Title>
<Body>
text text text
<Div>xxxxx</Div>
</Body>
</Html>
ending text
所以,我应该只得到“这里的一些文本”和“结束文本”......每个标签内的所有 html + 文本都不应该扣除。
另一个例子:
abcdef<div>xyz</div>
它应该返回“abcdef”
任何方法或建议将不胜感激。 谢谢
【问题讨论】:
-
不确定您的示例是否如您所愿?
-
我认为您的示例需要重做。您似乎从他们那里丢失了 HTML 标记...
-
如果它看起来像这样:
abc<div>hi there</div>cats are > dogs?换句话说,您对杂散文本是否真的 HTML 有多少挑剔?