【发布时间】:2011-09-27 08:24:21
【问题描述】:
我们在我们的网站上实施了一项新的访问次数功能,当访问我们网站上的公司资料时,该功能会在我们的视图数据库中保存一行。这是使用每次加载页面(公司简介)时运行的服务器端“/addVisit”函数完成的。不幸的是,这意味着我们昨晚有超过 400 次来自 Googlebot 的访问。
由于我们确实希望 Google 将这些网页编入索引,因此我们无法使用 robots.txt 在这些网页上排除 Googlebot。
我还了解到使用 jQuery $.get() 运行此函数不会停止 Googlebot。
唯一可行的解决方案是排除已知的机器人 IP 还是有选项?
或者可能使用带有 robots.txt 排除 /addVisit 的 jQuery $.get(/addVisit) 会阻止 googlebot 和其他机器人运行此功能?
【问题讨论】:
-
下面的两个答案似乎都可以解决问题。我决定使用 jQuery $.post(/addVisit) + robots.txt 禁止 /addVisit。我确信使用 jQuery 或使用客户端都有优势。对我来说,使用 robots.txt 告诉机器人不要点击链接比解析机器人用户代理感觉更正确。