【发布时间】:2020-12-13 11:00:57
【问题描述】:
我正在尝试从 tumblr 下载许多(1000 张)带有特定标签(例如 #art)的图像。我试图找出最快和最简单的方法来做到这一点。我已经考虑将 scrapy 和 puppeteer 作为选项,并且我阅读了一些关于 tumblr API 的信息,但我不确定如何使用 API 在本地下载我想要的图像。 目前,puppeteer 似乎是最好的方法,但我不确定如何处理 tumblr 使用延迟加载的事实(例如,获取所有图像、向下滚动、等待图像加载和获取的代码是什么?这些) 非常感谢任何提示!
【问题讨论】:
-
您可能希望使用 API 来检索图像的链接,然后使用另一个程序将这些图像下载到您的计算机。该API实际上相当易于使用,并且可以进行您想要的大规模收集。
-
谢谢原田!我从来没有使用过 tumblr API,你能给我更具体的说明吗?
标签: web-scraping scrapy puppeteer tumblr pytumblr