【发布时间】:2018-02-24 21:14:49
【问题描述】:
我正在使用 Scrapy 并尝试抓取 this 网址,当我请求页面上有关产品的任何数据时,我将其取出。但是带有分页器类和 id=paginator1 的 div 被返回为空,即使它是一个包含对下一页的引用的表。我尝试将 xPath 选择器用于表和 css 选择器,但都返回空。 这是我尝试过的,使用 css
In [29]: response.css('span a::attr(href)').extract()
Out[29]:
['/registration/formregistration/new',
'/',
'/catalog/solntsezaschitnye_ochki',
'http://wezom.com.ua/prodvizhenie']
和
In [31]: response.xpath('//*[@id="paginator1"]/table/tbody/tr[1]/td[2]/span')
Out[31]: []
【问题讨论】:
标签: python web-scraping scrapy