【发布时间】:2017-10-21 18:41:57
【问题描述】:
使用 Python 请求库打开大约 82,000 行的大页面时,我遇到了这个问题。在我尝试使用 urllib2 之前,这里出现错误“IncompleteRead”
现在有请求:
r = requests.get(https://www.bhphotovideo.com/c/search?atclk=Model+Year_2016&Ns=p_PRICE_2|0&ci=13223&ipp=120&N=4110474291+4294948825+3665082495)
page_source = r.content
print page_source
源打印结果不完整,我看到结束标记,但不是从文档开始!
您知道如何加载此 URL 的全部内容吗? 82000 行。
【问题讨论】:
-
这可能只是您使用的 shell 的限制。尝试将
page_source保存到文件中。 -
但是为什么我只能看到源代码的结尾部分呢?
-
因为大多数 shell 都有缓冲区限制。一次只能显示
X数量的字符,因此显然这些将是最后一个X字符。
标签: python parsing url get python-requests