【发布时间】:2015-07-14 16:12:19
【问题描述】:
我正在尝试使用 HtmlAgilityPackage 从新闻文章中抓取数据,链接如下http://www.ndtv.com/india-news/vyapam-scam-documents-show-chief-minister-shivraj-chouhan-delayed-probe-780528
我在下面编写了以下代码来提取本文中的所有 cmets,但由于某种原因,我的变量 aTags 返回空值
代码:
var getHtmlWeb = new HtmlWeb();
var document = getHtmlWeb.Load(txtinputurl.Text);
var aTags = document.DocumentNode.SelectNodes("//div[@class='com_user_text']");
int counter = 1;
if (aTags != null)
{
foreach (var aTag in aTags)
{
lbloutput.Text += lbloutput.Text + ". " + aTag.InnerHtml + "\t" + "<br />";
counter++;
}
}
我也使用过这个 XPath,但结果还是一样 //div[@class='newcomment_list']/ul/li/div[@class='headerwrap']/div[@class='com_user_text'] 请帮助我使用正确的 Xpath 来提取所有 cmets 找遍了整个网络,但没有解决方案。
【问题讨论】:
标签: html asp.net xpath html-agility-pack