【发布时间】:2014-10-15 18:40:53
【问题描述】:
我有一个下载的 html 文件,看起来像这样
<html class="theme_">
<head>
<body>
<div id="ad_1"></div>
...
<div id="wrapper">
<div id="top" style="height:11px;color:white;font-size:9px;font-weight:bold;"> </div>
...
<div id="content" style="border-top:none;">
...
<table id="user_list">
<tbody>
<tr class="trodd">
<td width="10%" valign="center" align="center">
<td class="list_art" style="width:160px;">
<td class="main_entry">
<h4>
<h5>
<a class="list_album" href="https://rateyourmusic.com/release/single/electra__ita_/feels_good__carrots_and_beets_/" title="[Album833409]">Feels Good (Carrots & Beets)</a>
<span class="rel_date">(1982) [Single]</span>
</h5>
</td>
<td></td>
</tr>
<tr class="treven">
我需要访问表user_list 的每个<tr class="trodd"> 和<tr class="treven"> 条目并检索href。这是我现在拥有的代码,它只返回一个空数组。我无法理解的一件事是,cheerio 是否能够像这样找到每个class="list_album",或者您必须使用一堆$( ) 沿着文件的层次结构向下移动。
var cheerio = require("cheerio");
var file = "...path...";
var links = [];
var $ = cheerio.load(file);
$('list_album').each( function () {
var link = $(this.attr('href'));
links.push({"link": link});
});
console.log(links);
【问题讨论】:
标签: javascript jquery node.js