【发布时间】:2017-05-12 22:36:07
【问题描述】:
我正在从该站点抓取一些数据:https://masteroverwatch.com/profile/pc/us/calvin-1337,特别是 span.summary-hero-name。这是我这样做的代码:
scrapeIt("https://masteroverwatch.com/profile/pc/us/calvin-1337", {
title: "span.summary-hero-name"
}).then(page => {
console.log(page.title)
});
这会返回应该做的McreeWidowmakerBastion,因为summary-hero-name 类有3 个英雄,但我只想要源代码中的第一个(这是最常用的)。如果那不可能,那么我希望满足href 是/profile/pc/us/Calvin-1337/heroes/6 的条件(这是最重要的)。
【问题讨论】:
-
其余代码在哪里?我很想知道您是否可以将 title: 替换为 span.summary-hero-name:first 以仅获取第一个英雄。
标签: javascript html node.js web-scraping tags