【发布时间】:2020-08-13 14:49:29
【问题描述】:
我正在尝试使用 xpath 从以下 html 中提取文本:
<p class="event-meta" xpath="1">Nanizanka / <span itemprop="genre">Akcija</span>,
<span itemprop="partOfSeason" itemscope="" itemtype="http://schema.org/CreativeWorkSeason">
<span itemprop="seasonNumber">8</span>. sezona,
</span>
<span itemprop="episodeNumber">9</span>. del,
United states of America
<br><i class="fa fa-clock-o"></i> <span>
51
</span> min |
IMDB: 7,3 |
<span>★</span>
<span>★</span>
<span>★</span>
<span>★</span>
<span>★</span>
<span>★</span>
<span>★</span>
<span class="hollow-star">★</span>
<span class="hollow-star">★</span>
<span class="hollow-star">★</span>
</p>
我在提取美国和 IMDB 分数时遇到问题,因为它们没有任何标签? 我无法超越
response.xpath("//div[@class='row nogutter article']/div[@class='col-10']/main/article/p[@class='event-meta']//text()").extract()
因为我只需要将国家和 IMDB 分数作为两个单独的项目。
您的帮助将不胜感激。
【问题讨论】:
-
试试
//span[@itemprop="episodeNumber"]/following-sibling::text()