【问题标题】:Cannot seem to scrape a div class tag in Node.js似乎无法在 Node.js 中抓取 div 类标记
【发布时间】:2016-01-21 18:57:44
【问题描述】:

我是 node.js 的新手。我的经验是使用 Java 和 VBA。我正在尝试为一个朋友抓取一个网站,一切都很顺利,直到我无法得到我想要的东西。

<div class="gwt-Label ADC2X2-c-q ADC2X2-b-nb ADC2X2-b-Zb">Phone: +4576 102900</div>

那个标签只有一个文本。没有attr或任何东西。但是我不能用cheerio刮掉它。

if(!err && resp.statusCode == 200){

    var $ = cheerio.load(body);

    var number = $('//tried everything here!').text();
    console.log(number);

这个功能我也玩过

    $('.ADC2X2').filter(function(i){
        console.log("Sdfs");
        console.log (i);

任何建议将不胜感激。

谢谢大家!

【问题讨论】:

  • 你能提供更多细节吗?你能写出准确的标签吗?
  • 电话:+4576 102900
    就是一个例子,我如何获得电话号码?谢谢!

标签: node.js screen-scraping cheerio


【解决方案1】:

我从cheerio documentation那里得到答案。

$(".gwt-Label").text();

如果这不起作用,也许您的页面中有很多框架。 另一种可能性是页面是客户端的渲染器,如角度页面,因此您的搜索元素不在服务器 html 中,而仅在页面加载后创建。 如果是这样,您将使用像 phantomjs 这样的完整浏览器,而不仅仅是像 Cheerio 这样的 dom 遍历器工具。

【讨论】:

    猜你喜欢
    • 2020-12-11
    • 1970-01-01
    • 2023-03-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多