【发布时间】:2013-08-11 21:33:51
【问题描述】:
我构建了一个tool,它利用 EmberJS 和 GitHub Pages 创建了一个在浏览器中呈现的博客应用程序。它使用 JavaScript 获取 Markdown 文件并将它们呈现到应用程序的主体中。因为所有内容都是通过 AJAX 请求获取的,所以我不确定让 Google 等可以抓取内容的最佳方法。
我有 read many articles 建议使用 PhantomJS 处理 _escaped_fragment_ 请求,但由于内容托管在 GitHub 上,因此无法在服务器端运行任何东西。
是否有可能的解决方法(例如在将内容推送到 GitHub 之前提前渲染一些内容)还是我只是遇到了 JavaScript 应用程序的缺点?
【问题讨论】:
-
“服务器”只是托管在 GitHub 上的静态 Markdown 文件。
-
所以,要访问您的站点,没有
http://hodgesms.com/index.html。相反,我从 GitHub 加载一些东西,将其存储在我的计算机上并将文件加载到我的浏览器中?您没有用于启动和保存 js 链接的服务器吗?是吗? -
EmberJS 应用程序托管在 Web 上(例如,在 GitHub 页面或任何其他主机上)。该应用程序一旦加载,就会进行 AJAX 调用以获取 Markdown 文件(内容)并将它们显示在浏览器中。这些文件可以托管在 GitHub 上,也可以托管在网络上的任何地方,但不,您不需要将它们下载到您的计算机上并呈现页面。所以是的,您可以通过
http://hodgesmr.com访问该网站。 -
我认为您无法按照您描述的方式抓取它。您必须拥有具有不同路径部分的实际 URL,这些 URL 与包含在爬虫中的内容一起提供。它需要某种活动服务器来执行此操作或生成页面并存储它们。
标签: javascript ajax github ember.js seo