【发布时间】:2011-07-30 03:07:05
【问题描述】:
我已经创建了我的网站
site.com/#!/page/var1/ans1/var2/ans2
映射到
site.com/pages/page.php?var1=ans1&var2=ans2
使用 Javascript。我也做到了
site.com?_escaped_fragment_=/page/var1/ans1/var2/ans2
映射到
site.com/pages/page.php?var1=ans1&var2=ans2
使用 PHP,因此我的网站显然可以被 Google 抓取。我已经用 Google Fetch 对其进行了测试,它似乎可以工作。但是,我尝试测试我的网站的所有其他非 Google 蜘蛛都不能与使用 _escaped_fragment_ 的 google 技术一起使用。我想确保当 Google 蜘蛛进入 site.com 时,它会看到 x,去 site.com?_escaped_fragment_=/page 并正确抓取它。有什么方法可以确保它抓取我网站上的所有链接并抓取它们?我测试过的测试蜘蛛站点只列出了其中包含域完整路径的链接——但这是否意味着对于我网站上的所有链接,我必须将整个域放在它们之前?那会毁了我的ajax。
【问题讨论】:
标签: hash web-crawler