【发布时间】:2018-04-04 10:45:10
【问题描述】:
我在这个网站上得到了这个代码NTP
<h5>Soundbooster</h5> <br><br>
<p class="details">
<b>Filtro attuale</b>
</p>
<blockquote>
<p>
<b>Catalogo:</b>
Aliant</br>
<b>Marca e Modello:</b>
Mazda - 3 </br>
<b>Versione:</b>
(3th gen) 2013-now (Petrol)
</p>
</blockquote>
我正在尝试提取元素“Mazda - 3”,但无法获取它,它返回空白。 在代码中,“马自达-3”部分是品牌价值。我得到名称和版本值。
这就是我的实现方式:
for ntp in response.css('div.content-1col-nobox'):
name = ntp.xpath('normalize-space(//h5/text())').extract_first()
brand = ntp.xpath('normalize-space(//blockquote/p//text()[4])').extract_first()
version = ntp.xpath('normalize-space(//div/blockquote[1]/p//text()[6])').extract_first()
result = ("{} {} - {}".format(name, brand, version))
这篇文章与这篇文章相关,它在那里工作,但我意识到我只得到了部分数据。见这里:Scrapy add.xpath or join xpath
谁能帮帮我。
提前谢谢你。
【问题讨论】: