【发布时间】:2011-05-23 16:36:11
【问题描述】:
我到处寻找,发现数百万个 python 代理服务器,但没有一个能完全符合我的要求(我认为 :s)
我对 python 有相当多的经验,但我对 HTTP 协议的深奥秘境还是很陌生。
我认为可能有用的是一个非常简单的代理示例,可以连接到它,然后它自己会尝试连接到传递给它的地址。
另外,我认为让我感到困惑的是隐藏的东西所做的一切,例如。如果该类从 BaseHTTPServer.BaseHTTPRequestHandler 继承,那么在请求页面时究竟会发生什么,就像在我发现的许多示例中一样,没有对路径变量的引用,然后突然噗! self.path 在函数中使用。我假设它已被继承,但它最终如何使用所使用的路径?
如果这没有多大意义,我很抱歉,因为我对我的问题的想法可能被打乱了:(
如果您能想到任何可以使我的问题更清楚的事情,请建议我添加它。 xxx
编辑:
此外,非常感谢代理处理请求、请求页面(此时如何读取/修改数据)并将其传递给原始请求者的详细过程的解释链接 xxxx
【问题讨论】:
-
如果您想要执行的请求或响应有任何修改,您应该详细说明该处理是什么。例如。给定传递给您的 URL,您如何确定要连接的 URL? (不要说“相同”,因为那会回到你身上)。
-
嗯,详细地说,我的意思是 URL 过滤,访问数据以获取加权字数,或者任意编辑(仍然是通用的,但只是将其作为字符串访问是真正需要的)
-
您可能会觉得这很有用:null-byte.wonderhowto.com/how-to/…
-
我是 proxy.py、轻量级 http、https 和 websockets 代理服务器的作者,它作为单个 Python 文件分发,没有外部依赖。 github.com/abhinavsingh/proxy.py你可能想检查它的源代码以了解内部细节,谢谢。