【发布时间】:2009-10-15 01:51:26
【问题描述】:
如何在 C# 中使用正则表达式解析 HTML?
例如,给定 HTML 代码
<s2> t1 </s2> <img src='1.gif' /> <span> span1 <span/>
我正在尝试获取
1. <s2>
2. t1
3. </s2>
4. <img src='1.gif' />
5. <span>
6. span1
7. <span/>
如何在 C# 中使用正则表达式来做到这一点?
在我的例子中,HTML 输入不是像 XHTML 那样格式良好的 XML。因此我不能使用 XML 解析器来执行此操作。
【问题讨论】:
-
如何重写what正则表达式?请改写你的问题。您的样本不可读。
-
@Michael Petrotta,我已经编辑了我的帖子。
-
你的问题没有意义。您说您要解析 HTML,但您发布的示例代码不是 HTML。