【问题标题】:Scrapy combine text along with the boldScrapy将文本与粗体结合起来
【发布时间】:2014-05-04 17:46:50
【问题描述】:

使用 Scrapy,以下摘录仅适用于普通文本。它排除了我试图检索的所有粗体标签:

hxs.select('//td[@class="Info_Cell"]/text()').extract()

以下仅提取粗体文本,但不包括普通文本。

hxs.select('//td[@class="Info_Cell"]/b/text()').extract()

你将如何提取文本,正常和粗体标签。

【问题讨论】:

    标签: python web-scraping scrapy


    【解决方案1】:

    一般// 会递归提取所有子节点,所以在你的情况下你需要:

    hxs.select('//td[@class="Info_Cell"]//text()').extract()
    

    【讨论】:

      猜你喜欢
      • 2012-06-03
      • 2020-02-03
      • 1970-01-01
      • 2020-11-08
      • 1970-01-01
      • 1970-01-01
      • 2021-09-28
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多