【发布时间】:2015-11-03 21:39:27
【问题描述】:
我开始使用 scrapy 和 xpath 来抓取一些页面,我只是在使用 ipython 尝试简单的事情,我在 IMDB 等某些页面中得到响应,但是当我尝试在 www.bbb.org 等其他页面时我总是得到一个空列表。这就是我正在做的:
scrapy shell 'http://www.bbb.org/central-western-massachusetts/business-reviews/auto-repair-and-service/toms-automotive-in-fitchburg-ma-211787'
BBB 认证
自 2010 年 2 月 12 日起获得 BBB 认证的企业
BBB 已确定 Tom's Automotive 符合 BBB 认证标准,其中包括承诺……”
这一段的xpath是:
'//*[@id="business-accreditation-content"]/p[2]'
所以我使用:
data = response.xpath('//*[@id="business-accreditation-content"]/p[2]').extract()
但是data 是一个空列表,我正在使用 chrome 获取 Xpath,它可以在其他页面中使用,但是无论我尝试页面的哪个部分,我都什么也得不到。
【问题讨论】:
标签: python xpath web-scraping scrapy