【发布时间】:2018-02-07 12:29:27
【问题描述】:
大家好,我真的被困在这里,离解决方案太近了,这很痛苦:/我正在尝试创建一个网络爬虫脚本。
到目前为止我有:
- digitalOcean 的服务器设置
- 工作脚本
- 成功下载html响应文本
但我坚持尝试获取元素。 这是我到目前为止的工作代码:
var http = require('http');
var request = require('request');
var cheerio = require('cheerio');
http.createServer(function (req, res) {
request('http://www.xscores.com/soccer', function (error, response,
html) {
if (!error && response.statusCode == 200) {
var $ = cheerio.load(html);
res.writeHead(200, { 'Content-Type':'text/plain'});
res.end('html:'+html);
}
}); }).listen(8080); console.log('Server is running at
http://178.62.253.206:8080/');
这仍然是 Wip 进度,我还没有设置任何数据库,所以总体计划是将所有这些信息加载到我的服务器页面上的表或 div 元素中。
我想知道如何在 xscores 中循环遍历主队所在的类“score_home_txt score_cell wrap”的元素并将其显示在我的服务器上?
它是这样构建的:
<div class="score_teams score_cell">
<div class="score_home score_cell">
<div class="score_home_txt score_cell wrap">
TRACTOR SAZI
</div>
我习惯于使用 excel VBA 执行此过程,而使用 Cheerio 执行此过程是一种全新的体验。
任何帮助都将不胜感激
弗雷德里克
【问题讨论】: