【发布时间】:2012-11-12 03:40:09
【问题描述】:
我正在尝试解析此链接
http://www.sears.com/search=play%20station?pageNum=1&viewType=list
如果我在浏览器中打开该网站,它会完美运行。但是,似乎没有一个解析器可以工作(尝试 jsoup)。另外,我尝试对url进行curl和wget,但输出也不正确。
我试图检查网站是否真的重定向(301、302),但显然没有。
有人知道我做错了什么吗?
【问题讨论】:
-
我以为可能是用户代理,但似乎不是。
-
一些网站似乎对不明请求设置了某种类型的拦截器。 Facebook 也有类似的东西。
标签: html parsing curl html-parsing wget