【问题标题】:Python Scrapy extract_first() documentationPython Scrapy extract_first() 文档
【发布时间】:2017-12-13 13:44:24
【问题描述】:

this问题我了解到scrapy Selector类实例的方法extract_first()可以接受可选参数default,这非常有用。但是,我找不到任何描述此功能的相关official documentation。甚至Selector objects 下的Selector's reference 也没有提及。也许extract_first() 有一些更神奇的功能?有谁知道extract_first() 的完整描述在哪里可以找到?

【问题讨论】:

  • 你尝试过代码使用help(some_object.extract_first) 吗?有时它可以显示来自源代码的有用的注释
  • 您也可以使用import scrapy ; print(scrapy.__file__)查找源代码文件并在那里查看。
  • 在源代码中我发现它是模块 parsel 的一部分 - 更多 import parsel ; help(parsel.SelectorList.extract_first)
  • 谢谢各位。我没有尝试过您提出的任何选项。我会把它保存在我的未来案例中

标签: python scrapy


【解决方案1】:

您实际上可以在 the documentation 后面的短语后面找到它:

可以提供默认返回值作为参数,用来代替 None:

>>> response.xpath('//div[@id="not-exists"]/text()').extract_first(default='not-found')
'not-found'

还请记住,您可以在 GitHub repository 上提出文档改进建议

目前extract_first 没有其他令人惊奇的功能,只有在没有找到时设置默认值。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-02-26
    • 1970-01-01
    • 2019-07-21
    • 1970-01-01
    • 1970-01-01
    • 2020-02-01
    • 1970-01-01
    相关资源
    最近更新 更多