【发布时间】:2012-12-11 03:46:00
【问题描述】:
我需要用 javascript 抓取一个网页,看起来这在 http://snipplr.com/view/66996/renderedinteractive-javascript-with-gtkwebkitjswebkit/ 的示例中得到了解决 问题中提到的Extracting data from Web 代码使用 webkit 下载器类。我知道我需要调用 process_request 函数。我在请求中作为参数传递了什么。我查看了scrapy文档,看看我是否必须传递在scrapy中创建的请求对象,但这不起作用。
另外,我知道蜘蛛对象将作为最后一个参数传入 process_request。那应该是哪个对象?抱歉,我是 python、scrapy 和 webkit 的新手,所以可能会问一些有明显答案的问题。
【问题讨论】: