【发布时间】:2011-08-28 13:59:20
【问题描述】:
我有以下代码来打开和读取 URL:
html_data = urllib2.urlopen(req).read()
我相信这是从 HTTP 读取数据的最标准方式。 但是,当响应有chunked tranfer-encoding 时,响应以以下字符开头:
1eb0\r\n2625\r\n
<?xml version="1.0" encoding="UTF-8"?>
...
由于上述分块编码而发生这种情况,因此我的 XML 数据被损坏。
所以我想知道如何摆脱与分块编码相关的所有元数据?
【问题讨论】:
-
当您尝试在 Web 浏览器中加载源数据时会发生什么?你买的是 1eb0 还是 2625?这些(和其他)数字是否一致?
-
不,浏览器正确处理
标签: python urllib2 chunked-encoding httplib