【发布时间】:2013-07-23 08:15:05
【问题描述】:
我正在nodeJS 中构建一个爬虫,但遇到了一个我无法解决的问题。
某些网站使用特定位置的内容,我想找到一种方法来触发/操纵它。
顺便说一句,我知道这可能是一个复杂的问题。一些网站可能使用不同的方法来确定用户的位置。有没有通用的方法来实现这一点?我目前正在使用 Node 的 request 模块,并且我的标头设置如下:
'headers': {
'User-Agent': 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)'
}
有没有办法操纵我的标题来欺骗网站的位置?
【问题讨论】:
标签: node.js location web-scraping screen-scraping