【发布时间】:2012-06-28 10:47:12
【问题描述】:
我很难用 python 搜索谷歌图像搜索。我只需要使用标准 python 库(所以 urllib、urllib2、json、..)来完成它
有人可以帮忙吗?假设图像是 jpeg.jpg 并且在我运行 python 的同一个文件夹中。
我已经尝试了一百种不同的代码版本,使用标头、用户代理、base64 编码、不同的 URL(images.google.com、http://images.google.com/searchbyimage?hl=en&biw=1060&bih=766&gbv=2&site=search&image_url={{URL To your image}}&sa=X&ei=H6RaTtb5JcTeiALlmPi2CQ&ved=0CDsQ9Q8等……)
没有任何效果,它总是一个错误,404、401或损坏的管道:(
请给我看一些 python 脚本,它会用我自己的图像作为搜索数据(“jpeg.jpg”存储在我的计算机/设备上)来搜索谷歌图像
谢谢谁能解决这个问题,
戴夫:)
【问题讨论】:
-
Google 在阻止您抓取他们的网页方面比您在规避他们的保护方面做得更好,这可能并不令人惊讶。
-
不,更多的是我不懂urllib2。无论我是通过浏览器搜索,还是通过我的 android 手机通过 python 搜索,有时我都可以毫无错误地发布,但得到的结果我只是不明白。我已经研究 urllib2 好几天了,它似乎无处不在,有 mimetypes、标头、几种 urllib.. 然后有改变的配方......但没有关于如何正确使用 urllib 或 urllib2 的手册.网上有很多帖子。。但每一个都不一样。例如,这是一个发布到谷歌翻译的帖子:
-
这个 python 脚本可能会有所帮助:bit.ly/QjIy21