【问题标题】:How to create html snapshot in C#?如何在 C# 中创建 html 快照?
【发布时间】:2013-01-18 07:13:06
【问题描述】:

我有一个使用 Ajax 的页面,我想让它可以被 SEO 抓取。检查谷歌的规范(https://developers.google.com/webmasters/ajax-crawling),它说需要使用“#!”构建一个“漂亮的 url”,并为爬虫引擎构建一个 html 快照。那么如何在c#中创建html快照呢?

【问题讨论】:

    标签: html seo


    【解决方案1】:

    虽然我还没有在生产中使用它,但我发现 PhantomJs(一个基于 webkit 的无头浏览器)完全可以胜任这项任务。我写了一个Post on the subject

    DOM 加载完成,Ajax 请求完成后,我只是复制整个 dom,Phantom 也是使用 JavaScript 编写的,很容易将 DOM 内容获取为 HTML。

    这不是 C# 特定的解决方案,但界面很简单,PhantomJS 也可以在 windows 上运行。每当我在 URL 中收到带有 escaped_fragment 的请求时,匹配的 MVC 路由会将 Crawler 重定向到缓存的快照。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-04-24
      • 2020-03-01
      • 1970-01-01
      • 1970-01-01
      • 2018-04-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多