【发布时间】:2021-01-05 00:24:11
【问题描述】:
我有一个页面,其中包含屏幕截图中的表格,我正在尝试使用 puppeteer 进行抓取。我可以使用以下方法获取表格:
//table[contains(@class, 'table') and .//th[contains(text(), 'Sqft')]]
(在开发工具中测试)。
现在我想用 puppeteer 得到它。我试过了:
const page = await browser.newPage();
try {
await page.goto(URL).catch(console.error());
var content = await page.content();
const codeTableXpath = "//table[contains(@class, 'table') and .//th[contains(text(), 'Sqft')]]"
const tableHTML = await content.waitForXPath(codeTableXpath).catch(console.error('xpath'));
当我单步执行代码时,错误发生在最后一行。如何获取表格 html 进行进一步处理?
编辑:
【问题讨论】:
标签: javascript node.js xpath puppeteer