【发布时间】:2013-01-17 10:49:18
【问题描述】:
我有一个用于我的 java 后端的 ajax 前端,为了让抓取和HTML5 pushState 能够正常工作,我将使用HtmlUnit 来处理每个第一个请求中的 javascript。
我可以使用过滤器解决方法,不使用HtmlUnit 尝试减少服务器负载。
不管浏览器兼容性如何,哪个最适合服务器?
【问题讨论】:
-
Google 推荐这种方法 - 请参阅 developers.google.com/webmasters/ajax-crawling/docs/… 上的第 3 点,尽管我想这取决于您生成了多少内容。
-
我所有的内容都是 javascript 生成的,我只有一个 html 文件,我将模板插入其中,带有 Backbone 和下划线。
-
Google 的方法是使用 hashbang,但我使用 pushState,这就是问题所在。 PushState 要求对服务器的第一个请求返回完全处理的 html 文件。
标签: java javascript ajax htmlunit web-crawler