【问题标题】:how to cache extracted data in python如何在python中缓存提取的数据
【发布时间】:2018-03-05 14:13:18
【问题描述】:

我编写了一个刮板,它从几页中提取数据。现在我意识到它有时会中断(例如互联网中断)并且我丢失了所有(已经)抓取的数据并且必须重新启动抓取过程。

是否有模块或解决方案如何缓存我已经提取的数据,以防脚本再次中断?

最好的问候

【问题讨论】:

  • 将报废的数据写入文件
  • 太宽泛,给定 nocode

标签: python web-scraping


【解决方案1】:

我建议你使用scrapy 库,它已经实现了几种机制来保存数据和管理你的蜘蛛。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-05-01
    • 2021-10-10
    • 1970-01-01
    • 2017-10-01
    • 1970-01-01
    • 2022-10-24
    • 2022-01-26
    • 1970-01-01
    相关资源
    最近更新 更多