【问题标题】:Network multithread in pythonpython中的网络多线程
【发布时间】:2011-10-20 05:07:08
【问题描述】:

我正在用 Python 编写一个脚本,它会从我的 Web 服务器中抓取一些页面并将它们放入一个文件中。我正在为这个特定任务使用mechanize.Browser() 模块。

但是,我发现创建mechanize.Browser() 的单个实例相当慢。有没有一种方法可以相对轻松地使用多线程/多处理(即一次发出多个 GET 请求)?

【问题讨论】:

标签: python multithreading mechanize python-multithreading


【解决方案1】:

使用geventeventlet 获取并发网络IO。

【讨论】:

    【解决方案2】:

    如果您想要工业级 Python 网页抓取,请查看 scrapy。它使用 Twisted 进行异步通信,而且速度非常快。每秒爬取 50 页并不是不切实际的期望。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2010-09-13
      • 2023-04-01
      • 2016-03-12
      • 1970-01-01
      • 1970-01-01
      • 2010-09-17
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多