【发布时间】:2013-11-18 17:25:55
【问题描述】:
<div class="A">
<section class="B" data-vr-zone="B">
<header class="C"> BarFoo</header>
<ul class="list">
<li data-vr-contentbox="">
<a href="http://www.foobar.com/.../html">
<small>BarBar</small>
<span>Foo Bar foobarbar FooFoo?</span>
</a>
</li>
<li data-vr-contentbox="">
<a href="http://www.foofoobar.com/.../html">
<small>BarBarBar</small>
<span>Foo foo FooFoo?</span>
</a>
</li>
我想访问 HREF 属性中的 url。而 SPAN 中的文本——仅属于第一个列表项。
我有什么工作,但我正在寻找更好的方法。
var url = $('div .A').children().children().children().children()[0].attribs.href;
var title = $('div .A').children().children().children().children()[0].children[2].children[0].data;
【问题讨论】:
标签: javascript node.js web-scraping cheerio