【发布时间】:2013-08-21 17:51:05
【问题描述】:
只是一个实际问题。我确实需要检索站点的 HTTP 状态代码以及 IP 地址。
考虑到我通常需要解析 10k 到 150k 个域,我想知道哪种方法最有效。
我已经看到使用 urllib2.urlopen(site) 尝试下载连接到文件的整个文件流。同时 urllibs2 不提供将主机名转换为 IP 的方法。
鉴于我只对 HEAD 位感兴趣以收集 HTTP 状态代码和特定服务器的 IP 地址等信息,那么最好的操作方式是什么?
我应该尝试只使用套接字吗?谢谢
【问题讨论】:
标签: sockets python-2.7