【发布时间】:2017-08-02 06:58:56
【问题描述】:
我一直在尝试抓取一些网站(基于 AJAX)用于我的研究。我有一个条件,我应该在不登录相应网站的帐户的情况下抓取内容。
怀疑
我可以看到页面源代码在登录和不登录的情况下存在巨大差异。我知道这是因为 AJAX,但我需要以某种方式抓取其中一个网站,最好是 pinterest。我是网络抓取的新手,所以请告诉我如果你们对如何去做这件事有任何想法
附加条件
没有硒解决方案或基于 Web 驱动程序的解决方案。
【问题讨论】:
标签: ajax web-scraping scrapy screen-scraping pinterest