【发布时间】:2017-02-16 07:46:05
【问题描述】:
我已经使用这个链接成功地用 Tor 运行了 Scrapy:http://pkmishra.github.io/blog/2013/03/18/how-to-run-scrapy-with-TOR-and-multiple-browser-agents-part-1-mac/
但我无法使用 Tor 运行 Splash。
在 Scrapy-settings.py 中,我针对 http_proxy(8123 是 polipo 端口)定向到 polipo:
HTTP_PROXY = 'http://127.0.0.1:8123'
在 polipo.config 中,我定向到了 tor(9150 是 tor 端口):
socksParentProxy = localhost:9150
diskCacheRoot=""
非常适合scrapy。在飞溅中它不起作用。但我不得不说 splash 或 docker 使用 polipo 来作为 http_proxy,就像在 scrapy-settings.py 中一样。 Docker 应该以某种方式使用 polipo,而 polipo 将直接指向 tor。我该怎么做?
我用以下方式运行飞溅:
sudo docker run -p 5023:5023 -p 8050:8050 -p 80511 scrapinghub/splash
在 etc/default/docker 中,我尝试使用 docker 将其定向到 polipo:
export http_proxy='http://127.0.0.1:8123'
Environment="http_proxy=http://127.0.0.1:8123"
但我没能成功。我究竟做错了什么?谢谢:)
【问题讨论】:
标签: scrapy tor scrapy-splash splash-js-render polipo