【发布时间】:2012-02-05 20:52:40
【问题描述】:
我正在尝试从网站获取数据,但首先我需要使用 java 登录到该网站。该脚本一直有效,但现在该站点安装了反僵尸系统。到目前为止,过程很简单,我创建了一个 HttpStreamWriter 并将我的详细信息提交到 login.php 页面,然后获取 cookie,然后当我想从站点获取数据时,我从 login.php 重新提交 cookie页面,但现在有一个问题:一个反僵尸系统: 我不确定,但我认为这是系统: https://github.com/yuri-gushin/Roboo/blob/master/Roboo.pm
anti-bot 系统创建了一个名为 anti-bot 的 cookie,没有该 cookie 我无法访问页面,问题是 cookie 仅在页面加载后由 flash 应用程序生成,所以我无法获取页面中的 cookie?
任何想法如何“破解”这个?谢谢!
【问题讨论】:
-
请注意单引号 (') 和重音符 (`) 之间的区别 您应该始终使用单引号作为撇号,因为 SO 使用重音符将文本格式化为代码。您还可以更快地键入,因为无需按空格键即可正确显示字符。
-
您可以联系网站负责人,询问他们是否支持任何获取所需数据的方法。如果他们不这样做,并且已经设置了您提到的“反机器人系统”以阻止人们做您想做的事情,那么也许您应该考虑尊重这一点?