【问题标题】:Block Select List Data from Google Bot阻止来自 Google Bot 的选择列表数据
【发布时间】:2011-12-07 19:19:09
【问题描述】:

当 Google 的蜘蛛抓取我的一个网站时,它们会从选择列表中提取数据作为页面数据。我完全理解为什么会发生这种情况,但问题是,它可以以任何方式被阻止吗?我不想阻止整个页面被抓取,而只是选择列表数据。

问题如下:在谷歌搜索时,选择列表数据显示为页面摘要,而不是内容。描述标签是专门为帮助 SEO 和为潜在的网站访问者提供有用的信息而编写的,但它的预期功能没有得到实现。

查看此示例案例https://www.google.com/search?q=alaskan klee kai site%3Awiki-pet.com

这会损害网站搜索性能的有效性,因为超过 1 个页面在搜索结果中显示相同的数据。有超过 200 个页面具有完全相同的选择列表,便于导航。选择列表不会被删除。

我的一个想法是在页面出现后用 onload() 脚本填充内容

完全加载..有什么想法吗?

[编辑]

查看包含以下文本的搜索结果 #3 和 5:“All Breeds - - -, Affenpinscher, Afghan Hound, Airedale Terrier, Akbash Dog, Akita, Alapaha Blue Blood Bulldog, Alaskan Klee Kai, Alaskan ...”

这是直接来自相关页面上的选择列表的内容。

【问题讨论】:

  • 我找到了 2 种可能的解决方案,这两种解决方案充其量都是粗略的。 1) 添加雅虎的 class=”robots-nocontent” 2) Google 有一个 标签用于可能有效的广告..
  • 对于将来遇到此问题的任何人,我建议在页面加载完成后使用 JS 加载您不希望被蜘蛛抓取的项目(一种“延迟加载”)。

标签: php html seo


【解决方案1】:

在服务器上,检查用户代理是否匹配Googlebot(或其他流行的蜘蛛,例如bingbot)并且不呈现该内容。

【讨论】:

  • 据我所知,您不能从机器人中排除某些 DIV 内容。通过 robots.txt 可以轻松排除整个页面,但这是不可取的。
  • @BizLab:是的,你可以。只需检查 if 中的 User-Agent 标头即可。
猜你喜欢
  • 2016-06-17
  • 1970-01-01
  • 1970-01-01
  • 2016-09-05
  • 2022-01-24
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多