【发布时间】:2014-12-03 02:58:27
【问题描述】:
我想使用 HtmlAgilityPack 从 GSMArena.com 抓取内容,具体来说,我想抓取手机的技术规格。
期望的结果:
http://www.gsmarena.com/nokia_lumia_520-5322.php 我想刮下重量、尺寸等
问题: 几乎所有模型的节点路径都不同。
我的问题:
我将如何通过搜索进行抓取?例如,如果我想刮产品重量,有没有办法告诉HTMLAgilityPack搜索一个标签,然后去它后面的TD,然后刮那个TD的内部文本?
【问题讨论】:
标签: c# html-agility-pack