【问题标题】:Google search and restricted contents? [closed]谷歌搜索和限制内容? [关闭]
【发布时间】:2013-04-28 21:58:09
【问题描述】:

如果一个网站有一个内容如果有人没有登录就看不到,那么,谷歌如何看到它?

该页面是电子商务,访问受限(用户必须登录才能查看产品)页面;因此 Google 看不到这些产品?

处理这个问题的正确策略是什么?

【问题讨论】:

  • Google 只能看到用户在没有登录的情况下看到的内容。显示不同的内容是违反他们的政策的。
  • 有什么策略可以让谷歌知道这是一个电子商务网站吗?
  • 这里的问题是什么?您希望 Google 将受限区域编入索引还是阻止它这样做?
  • 不,我希望谷歌知道它是一个电子商务网站
  • 那没有回答问题。 Google 应该如何处理这些信息?

标签: web-crawler google-search


【解决方案1】:

如果是 Google-Adsense,这个问题可能是有道理的。 Google 为此提供了站点身份验证功能:请参阅 - Google AdSense launches site authentication

您可以向 google 提供您的用户名和密码,然后 google bot 可以抓取您受保护的页面 - 这样当访问者访问该页面时,它可以更好地投放有针对性的广告

另外 - 如果这不是预期目的,请记住向 Google 提供不同的内容与向没有用户名和密码的用户提供的内容是明显错误的。
想象一下,你在谷歌上搜索了一些东西,当你点击第一个链接时——网站出现了一个注册页面,但没有任何有用的信息!!

【讨论】:

  • 是的,但这是我发现知道谁访问页面并限制对服务器的请求的唯一策略(因为只有注册用户才能访问,所以我可以想象请求的数量有多少) 因为在阿尔及利亚这里的带宽是有限的
  • 如果目的只是为了获取信息,那么您可以使用 Google Analytics - 即使在免费版本中也有详细的报告。
  • 啊,谢谢,所以我会这样做,因为我想做的只是让谷歌知道该页面是一个电子商务网站。
【解决方案2】:

您可以使用提供的 User Agent 标头来检测 Google bot 是否正在访问您的站点并将其处理为好像该 bot 是已登录的普通用户一样。这在 phpBB 之类的程序中实现(在该程序中作为特殊的可见性选项)。

该解决方案的缺点是您不能依赖提交的 User Agent 标头,因为很容易发送精心设计的标头,因此您在网站上显示为 Google bot(有扩展,例如用于 Firefox提供此类功能)。

【讨论】:

  • 我使用 Tornado (python),是的,这是个好主意,因为我这样做是为了捕获用户代理并忽略一些机器人,所以我可以将来自 google 机器人的那些视为注册用户
猜你喜欢
  • 2012-08-27
  • 2011-04-13
  • 2017-05-08
  • 2013-09-24
  • 1970-01-01
  • 2016-07-27
  • 2014-09-23
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多