【发布时间】:2013-12-08 21:39:56
【问题描述】:
我正在尝试编写一个小型 HTTP 本地代理服务器以在我的机器上运行并运行一些测试。 我的服务器目前运行良好,可以很好地处理请求。
但是,当我尝试分析打包程序时 - 我遇到了问题。
我正在我的数据包中搜索标签“”,并在找到时将消息打印到日志中。 它适用于数量非常有限的网站,而在其他网站(例如 StackOverflow)上则不行。
在接收到的数据中搜索单词之前,是否需要进行某种解码?如果是这样 - 哪个解码?如何重新编码数据以提供给浏览器?
这是我的搜索和替换代码:
data = i.recv(8192)
if data:
if "<head>" in data:
print "Found Head Tag."
上面的代码是一个简单的python代码,用来从socket中获取数据,保存到数据对象中,然后搜索想要的标签。正如我所说,它适用于极少数网站,而不适用于其他网站。
【问题讨论】:
标签: python arrays sockets replace byte