【发布时间】:2016-12-04 22:30:03
【问题描述】:
对于我的学士论文,我需要从大约 40000 个网站中获取一些数据。因此,我正在使用 python 请求,但目前从服务器获得响应真的很慢。
有没有办法加快速度并保持我当前的标题设置?我找到的所有教程都没有标题。
这是我的代码片段:
def parse(url):
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/39.0.2171.95 Safari/537.36'}
r = requests.get(url, headers=headers)
for line in r.iter_lines():
...
【问题讨论】:
-
使用
multiprocessing怎么样? stackoverflow.com/questions/28393617/… -
@bsa 不需要多处理,新进程开销太大,线程更适合io绑定。