【发布时间】:2016-03-14 14:21:52
【问题描述】:
我尝试从亚马逊抓取一些数据,我需要按此页面上的评论数量对书籍进行排序:www.amazon.com/s/ref=lp_283155_nr_n_0?fst=as%3Aoff&rh=n%3A283155%2Cn %3A!1000%2Cn%3A1&bbn=1000&ie=UTF8&qid=1457964444&rnid=1000 如果我用scrapy框架解析这个页面,表单标签不知怎么就消失了,所以我无法抓取它,这是为什么呢??
我的浏览器是这样看的: [1]:http://i.stack.imgur.com/sSrsK.jpg
scrapy 框架是这样看的: [2]:http://i.imgur.com/TEDILP8.jpg?1
这是我用scrapy的open_in_browser()方法打开页面时看到的
这很奇怪,我不知道出了什么问题 感谢您的帮助
【问题讨论】:
-
我不知道scrapy ...页面上运行的javascript会改变浏览器中的结果但scrapy中没有吗?
-
该页面在没有 javascript 的情况下完美运行我认为这不是我的问题,但谢谢
标签: python web-scraping scrapy scrapy-spider scraper