【发布时间】:2020-10-31 01:10:29
【问题描述】:
我正在使用 css 选择器并不断得到空值的响应。这是代码。
import scrapy
class WebSpider(scrapy.Spider):
name = 'activities'
start_urls = [
'http://capetown.travel/events/'
]
def parse(self, response):
all_div_activities = response.css("div.tribe-events-content")#gdlr-core-pbf-column gdlr-core-column-60 gdlr-core-column-first
title = all_div_activities.css("h2.tribe-events-list-event-title::text").extract()#gdlr-core-text-box-item-content
price = all_div_activities.css(".span.ticket-cost::text").extract()
details = all_div_activities.css(".p::text").extract()
yield {
'title':title,
'price':price,
'details':details
}
【问题讨论】:
-
嗨,我可以知道预期的输出是什么吗?
-
@balandongiv {'title': [Stellenbosch on Stage: Libertas Choir virtual concert], 'price': [ZAR100], 'details': [世界级的 Libertas Choir 将表演一场7 月 11 日星期六的现场虚拟音乐会将让观众在家中舒适地观看独家表演。该节目是与 Visit Stellenbosch as Stellenbosch on Stage 联合举办的三项活动中的第一项,这是一项展示团结和团结的倡议。所有收益都将用于帮助 Stellenbosch Unite,这是一项在...]} 期间为弱势社区提供支持的合作项目
标签: python scrapy css-selectors web-crawler