【发布时间】:2022-01-23 22:20:31
【问题描述】:
我正在做一个 scrapy 项目,我试图在其中提取关于赞助的 TripAdvisor 列表 (https://www.tripadvisor.com/Hotels-g189541-Copenhagen_Zealand-Hotels.html) 的数据。
这就是html代码的样子
<div class="listing_title ui_columns is-gapless is-mobile is-multiline">
<div class="ui_column is-narrow">
<span class="ui_merchandising_pill sponsored_v2">Sponsored</span>
</div>
<div class="ui_column is-narrow title_wrap">
<a target="_blank" href="/Hotel_Review-g189541-d206753-Reviews-Scandic_Front-Copenhagen_Zealand.html" id="property_206753" class="property_title prominent " data-clicksource="HotelName" onclick="return false;" dir="ltr"> Scandic Front</a>
</div>
</div>
我能够使用response.css(".listing_title").css("a::text").extract() 等结构成功检索链接、ID、名称等元素。
但是,我无法从附加到住宿列表的“赞助”标签中检索任何内容 - 结果是一个空列表,尽管网站上有两个带有“赞助”标签的列表。
我试过response.css(".sponsored_v2").css("::text").extract()没有任何成功。
我能做什么?
【问题讨论】:
-
从您的错误描述看来,您使用了错误的方法名称。应该是
extract而不是exctract。始终发布您必须的代码的 sn-p,以便其他人更容易提供帮助。
标签: html css xpath scrapy css-selectors