【发布时间】:2013-06-19 09:12:49
【问题描述】:
我正在使用 Scrapy 一个月。我能够根据管道中给出的关键字抓取和抓取几个网站(事实上我已经抓取了 900 个网站)。现在,问题是当我们遇到 javapages(ajax)时,scrapy 不会抓取。我正在尝试使用以下代码selenium code for scraping ajax pages using scrapy 并进行适当的更改以抓取 ajax 页面
你们有什么好主意使用scrapy抓取javapages
第二个问题,我面临的是scrapy不抓取登录页面
【问题讨论】:
-
您能否更具体地说明您在抓取登录页面时遇到的问题?提供您正在使用的代码和网址。
-
@alecxe 。这是我的蜘蛛代码notepad.cc/huxido16
-
@StevenAlmeroth。我正在尝试使用下载中间件设置,但在 **import gtk ** 处出现错误。 error: from glib._glib import * ImportError: DLL load failed: The specified procedure could not be foun