【发布时间】:2019-03-03 16:09:28
【问题描述】:
我是网络抓取的新手,想使用 puppeteer 下载网页上的所有图像:
const puppeteer = require('puppeteer');
let scrape = async () => {
// Actual Scraping goes Here...
const browser = await puppeteer.launch({headless: false});
const page = await browser.newPage();
await page.goto('https://memeculture69.tumblr.com/');
// Right click and save images
};
scrape().then((value) => {
console.log(value); // Success!
});
我查看了API docs,但不知道如何实现这一点。所以感谢你的帮助。
【问题讨论】:
-
通常你会有一个图像的选择器/ID,然后可以获取 url。然后用 url github.com/GoogleChrome/puppeteer/issues/1937 做这样的事情
-
是的,我已经看到了这个问题,但无法使用它。你能用代码详细说明你的答案吗?
-
我发布了一个答案。这是我开始学习使用 Puppeteer 的地方。 medium.com/@e_mad_ehsan/… 它介绍了循环遍历元素并从中获取信息的基础知识
标签: javascript web-scraping puppeteer google-chrome-headless