【发布时间】:2011-09-27 21:22:56
【问题描述】:
我正在尝试从 HTML 中删除不必要的内容。具体来说,我想删除 cmets。我找到了一个很好的解决方案 (Grabbing meta-tags and comments using HTML Agility Pack),但是 DOCTYPE 被视为注释,因此与 cmets 一起被删除。如何改进以下代码以确保保留 DOCTYPE?
var htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(htmlContent);
var nodes = htmlDoc.DocumentNode.SelectNodes("//comment()");
if (nodes != null)
{
foreach (HtmlNode comment in nodes)
{
comment.ParentNode.RemoveChild(comment);
}
}
【问题讨论】: