【发布时间】:2019-11-13 06:02:59
【问题描述】:
我正在尝试将链接(或者更确切地说是列表 ID)抓取到此 website 第一页上的列表。 我认为正确的 css 选择器必须是
div.property-content-list > div.property-text > h3 > a::attr(href)
至少当我在元素检查器中搜索这个选择器(没有::attr(href))时,它似乎应该返回正确的数据。但是,在运行蜘蛛时,我得到一个空输出。
我是 scrapy 和 css 选择器的新手,但对大多数其他网站都了解。我的错误在哪里?
作为参考,这是我的蜘蛛的解析方法。
def parse(self, response):
for quote in response.css('div.property-content-list > div.property-text > h3 > a::attr(href)').extract():
yield {
"href": quote
}
谢谢
【问题讨论】:
标签: python scrapy css-selectors