【发布时间】:2015-08-07 11:05:36
【问题描述】:
这是我的代码:
var Xray = require('x-ray');
var x = Xray();
x('http://someurl.com', 'tr td:nth-child(2)', [{
text: 'a',
url: 'a@href'
}]).write('results.json')
我只需要使用每个 a 标签中的第一个单词来填充名为“text”的字段。标签值示例:
"FirstWord SecondWord ThirdWord"
实际结果是文本:FirstWord SecondWord ThirdWord
所需的结果文本:FirstWord
我可以对 result.json 文件进行后处理,但我不喜欢这种方式。
【问题讨论】:
标签: javascript node.js scraper