【发布时间】:2016-03-16 10:58:57
【问题描述】:
上下文:
我正在用 C# 开发一个桌面应用程序,用于从少数域中的单个网页中抓取/分析产品信息。我使用 HtmlAgilityPack 来捕获和解析页面以获取所需的数据。我为不同的域编写不同的解析规则。
问题:
来自一个特定域的页面,当通过浏览器显示时,可能会显示 60-80 种产品。但是,当我通过 HtmlAgilityPack 解析时,最多只能获得 20 个产品。查看 Firefox“查看页面源代码”中的原始 html,似乎也只有 20 个相关产品 div 存在。我得出的结论是,必须通过脚本加载剩余的产品,也许是为了减轻服务器上的负载。事实上,我有时会在浏览器中看到这种情况,因为在加载 20 多个产品时会出现短暂的暂停,然后再加载 20 个,等等。
问题:
如何通过 HtmlAgilityPack 或其他方式访问所有脚本编写完成后出现的全套产品 div?
【问题讨论】:
标签: c# html web-scraping html-agility-pack