【问题标题】:Scraping data uri image [duplicate]抓取数据uri图像[重复]
【发布时间】:2013-06-25 22:08:14
【问题描述】:

我想从网页中抓取图像,问题是图像作为数据 URI 包含在源代码中。如何将它们保存到文件中? (我只需要从特定的抓取数据 URI 代码访问 URI 图像)

【问题讨论】:

  • 您的意思是简单地下载给定 URI 的图像吗?在这种情况下,使用标准库中的模块(如 urllib2)非常容易
  • 是的,这就是我的意思,我在 urllib2 文档上看不到任何相关内容。

标签: python web-scraping uri scrape


【解决方案1】:

图像/字符串采用 base64 编码(甚至在 URI 本身中声明!)。您所要做的就是对其进行解码,然后将其写入文件。

imageContents = "/9j/4AAQSkZJRgABAQAAAQABAAD/2wCEAAkGBxQSEhUUE"
myfile = open("image.jpg","w")
myfile.write(imageContents.decode("base64"))
myfile.close()

【讨论】:

  • 谢谢马特,这很好用。
  • @user2521892:在这种情况下,您应该接受(并投票)这个答案(点击绿色勾号)。
猜你喜欢
  • 2013-09-14
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多