【问题标题】:Block a specific page in Robots.txt在 Robots.txt 中屏蔽特定页面
【发布时间】:2012-05-17 06:37:31
【问题描述】:

据此 http://support.google.com/webmasters/bin/answer.py?hl=en&answer=156449

Disallow: /page1/
所有 page1 URL 都将被禁止,即 page1/foo/bar 也将被阻止。
Disallow: /page1

只有page1 会被阻止,page1/foo/bar will 会被允许。
但这并没有发生,我怎样才能只阻止 page1 并允许 page1/foo/bar 被抓取

编辑: 实际问题是同一页面在不同路径中被爬网两次 如/page/page/

【问题讨论】:

    标签: drupal-6 seo robots.txt google-search


    【解决方案1】:

    为什么不添加一个机器人元标记?

    <meta name="robots" content="noindex, nofollow, noarchive"/>
    

    【讨论】:

    • 用实际问题编辑了问题,如果我阻止整个页面,那么两个结果都将被丢弃。现在我想知道规范标签是否会有所帮助
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-01-02
    • 1970-01-01
    • 1970-01-01
    • 2021-06-26
    • 1970-01-01
    相关资源
    最近更新 更多