【问题标题】:How to ignore/redirect all URLs matching a certain string如何忽略/重定向与某个字符串匹配的所有 URL
【发布时间】:2019-10-20 01:11:53
【问题描述】:

我正在使用 Wordpress 插件 Timely All-in-One 活动日历。不幸的是,它正在创建大量以字符串结尾的重复 URL,例如 (https://www.mywebsite.com/events/action~agenda/page_offset~-2/request_format~json/cat_ids~4) 或 (https://www.mywebsite.com/events/action~oneday/exact_date~2-4-2019/)。

由于这些 URL 指令各自用于不同的日历视图但包含相同的网页标题和内容,一些搜索引擎将其视为重复内容。虽然 robots.txt 设置为告诉机器人忽略包含所述字符串的 URL,但一些爬虫忽略了 robots.txt。我还禁用了各种不同的日历视图,因此现在只有议程视图,但尽管如此,机器人仍会继续抓取这些 URL。

因此,可以使用 Apache/ .htaccess 指令来告诉服务器引导任何包含“/action~”的请求,以便从 URL 中删除字符串以便浏览器只读取“/events/”或重定向/将 URL 转发到另一个页面。

这些 URL 有 500 多个,所以我希望有一个快速的补救措施!

提前致谢。

【问题讨论】:

    标签: .htaccess url http-status-code-301


    【解决方案1】:

    在您的 .htaccess 文件中检查此重写

    RewriteEngine On
    RewriteRule ^events\/action(.*)$ /events/ [L,R=301]
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-05-30
      • 1970-01-01
      • 2022-11-14
      • 1970-01-01
      • 2019-11-17
      • 1970-01-01
      • 2014-05-18
      • 1970-01-01
      相关资源
      最近更新 更多