【问题标题】:Why is my dynamically created content not searchable in Google为什么我的动态创建的内容无法在 Google 中搜索到
【发布时间】:2013-06-04 23:23:55
【问题描述】:

我的网站根据以下规范提供动态创建的内容以供爬虫查看: https://developers.google.com/webmasters/ajax-crawling/docs/specification。 这样,谷歌爬虫索引了大约 5000 个 URL,语法如下: http://www.unclestock.com//app.jsp?_escaped_fragment_=s=AAPL http://www.unclestock.com//app.jsp?_escaped_fragment_=s=GOOG

使用 Google 的网站管理员工具查看我的抓取报告,我确信这些页面已成功抓取。但是,在通过 Google 搜索时,它们不会显示为结果。 请注意,我确实找到了我的一般网站,在“更多结果”下,我找到了大约 40 个动态生成的页面,但显然这不是我想要的。我想根据内容(AAPL,GOOG,...)找到返回的页面 也许,爬虫认为我的页面或多或少相同.. 但事实并非如此。

【问题讨论】:

标签: ajax web-crawler


【解决方案1】:

Google 通常只会在看到带有 #! 的 URL 时才会请求带有 ?_escaped_fragment_= 的页面。在里面。这些页面将被索引为 #! (这样点击 Google 搜索结果中的链接将转到带有 #! 的 URL),而不是索引为 ...escaped_fragment...

您说 Google 已将包含“escaped_fragment”的网址编入索引 - 但如果您准确引用它们,Google 从未见过网址“http://www.unclestock.com/app.jsp?#!s=AAPL” - 如果有,会有两个 ?在 app.jsp 作为 #!替换为 ?#!_escaped_fragment_=

我的印象是jsp代码需要有?在 #! 之前的 URL 中所以该网站将无法正常工作

.../app.jsp#!s=AAPL

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-11-18
    • 2016-07-04
    • 2016-03-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多