【发布时间】:2012-01-31 00:40:02
【问题描述】:
我目前正在使用不同的抓取技术并发现,当涉及大量 javascript 时,它会很快变得非常复杂。 我在 HTMLUnit 上取得了一些成功,它似乎可以很好地解释 javascript,但我正在寻找一个更轻量级的解决方案。
所以我现在面临的问题是:我想检索特定页面的结果,该页面是通过单击某个按钮通过 ajax 调用生成的。 调用本身相当简单,只是一个到某个 URL 的 HTTP Post,并在 post 正文中提交了一些参数。我现在遇到的问题是,当我将 HTTP Post 提交给 ajax 函数而没有真正打开包含站点时,服务器会抱怨。
我基本上做的测试是:
curl -v -d "AJAXREQUEST=..." https://myhost/ajaxurl
我得到的是:
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta name="Ajax-Response" content="true" />
<meta name="Ajax-Expired" content="View state could't be restored - reload page ?" />
</head>
</html>
服务器正在运行 JSF 1.2。我该怎么做才能从 AJAX 调用中获得结果?我不是真正的 JSF 专家...
【问题讨论】:
标签: ajax http jsf web-scraping