【发布时间】:2015-06-19 06:04:09
【问题描述】:
我正在使用Twisted 编写一个由Selenium 驱动的网络爬虫。这个想法是我为一个扭曲的客户端和一个扭曲的服务器生成扭曲的线程,它将代理 HTTP 请求到服务器。看起来像这样的东西:
+--------+ +--------+
| +------>+ |
-->| Client | | Server |---> WWW
| +<------+ |
+--------+ +--------+
不过,所有这些都在同一个进程中运行。问题是,twisted 是否允许这种应用程序,或者只是被认为将 Client 和 Server 作为不同的进程运行(因为这是我在任何地方都看到的典型案例)。
【问题讨论】:
-
你会分享你的代码吗?
-
是的,我会的。我计划很快发布它。
标签: python selenium web-crawler twisted