【发布时间】:2011-11-23 09:40:50
【问题描述】:
我在 Node 中创建了一个相对简单的代理,它允许我下载页面并显示它们。这很好,尽管一些 scripts、links、forms 和 images 似乎已损坏,因为它们指向相关文件。作为一个项目,我正在尝试创建一个功能齐全的网络代理。
Proxify 这样的网站是如何解决这个问题的?
参考方案:
var app = require('express').createServer();
var request = require('request'),
sys = require('sys'),
fs=require('fs');
app.get('/url', function(req, res){
console.log(req.query.link);
request({ uri: req.query.link,
headers: {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; rv:6.0) Gecko/20110814 Firefox/6.0"}
}, function (error, response, body) {
if (error && response.statusCode !== 200) {
console.log('Error when contacting google.com')
}
res.send(body, {"Content-type": "text/html"});
res.end();
});
});
【问题讨论】:
标签: node.js proxy screen-scraping relative-path