【发布时间】:2021-09-17 06:18:32
【问题描述】:
我正在尝试从webpage 中抓取指向下一页的链接。我知道如何使用 css 选择器来抓取它。但是,当我尝试使用 xpath 解析相同的内容时出现问题。 This 是我得到的,而不是下一页链接。
const puppeteer = require("puppeteer");
let url = "https://stackoverflow.com/questions/tagged/web-scraping";
(async () => {
const browser = await puppeteer.launch({headless:false});
const [page] = await browser.pages();
await page.goto(url,{waitUntil: 'networkidle2'});
let nextPageLink = await page.$x("//a[@rel='next']", item => item.getAttribute("href"));
// let nextPageLink = await page.$eval("a[rel='next']", elm => elm.href);
console.log("next page:",nextPageLink);
await browser.close();
})();
如何使用 xpath 抓取到下一页的链接?
【问题讨论】:
标签: javascript node.js web-scraping xpath puppeteer