使用 HTMLAgilityPack 解析不是来自 URL 的 HTML 字符串答案

【问题标题】：Using HTMLAgilityPack to parse an HTML string not from a URL使用 HTMLAgilityPack 解析不是来自 URL 的 HTML 字符串
【发布时间】：2011-08-02 15:37:21
【问题描述】：

我正在尝试获取我通过 vb.net 代码标记的字符串，并与它最初来自的文本文件进行交叉检查。这是为了校对 html 输出。

为此，我需要解析不是来自 URL 的 HTML sn-p。

我看到的 HTMLAgilityPack 示例从 URL 获取输入。有没有办法解析一串不包含标题或格式良好网页的类似部分的标记文本？

谢谢

【问题讨论】：

标签： vb.net html-agility-pack

【解决方案1】：

要解析包含 HTML sn-p 而不是文件或 URL 的字符串，您可以按照 @Oded 的建议使用 HtmlDocument，但不要使用 doc.Load()，而是使用 doc.LoadHtml()。

String HtmlSnippet = "<p>Example <strong>Html</strong> snippet</p>";
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(HtmlSnippet);

【讨论】：

【解决方案2】：

而不是WebDocument 使用HtmlDocument：

HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");

这是HAP examples page上的第一件事。

【讨论】：