【发布时间】:2017-08-25 09:55:02
【问题描述】:
我在我的根 robots.txt 上试过这个:
User-agent: *
Allow: /
Disallow: /*&action=surprise
Sitemap: https://example.com/sitemap.php
我想从抓取网址中排除:
https://example.com/track&id=13&action=surprise&autoplay
从access.log 文件中,我再次看到一些机器人访问了这些网址。
是我做错了什么还是只是某些机器人没有遵循我的robots.txt 设置?
【问题讨论】:
-
我忘记了主要工具! Google 在网站管理员控制台中有一个
robots.txt测试员。我的robots.txt看起来是正确的,但是像 Ahrefs 这样的坏机器人会忽略它。
标签: robots.txt