【发布时间】:2013-02-27 03:56:48
【问题描述】:
我正在查看 Google 搜索结果:“site:mywordpress.org”。并发现不应该存在的地段或页面被编入索引。
这里有两个问题:
我不知道 Google 是如何定位、抓取或找到这些网址的。
Wordpress 没有显示 404 错误,因此看起来像是重复的内容。
我尝试了 Wordpress 支持论坛,但没有人回复。我也找不到任何人报告这个问题。这是我看到的一个例子:
mywordpress.org/blog-post/
mywordpress.org/blog-post/1363035032000/
我添加了一个指向头部的规范链接引用,并且我已经做了很多 Google WMT 删除请求,但我仍然看到一些类似的结果。
我已经在几个 wordpress 安装中对此进行了测试,似乎如果您在永久链接的末尾添加任何数字字符串,它仍然会显示内容而不是显示 404 错误。
我还注意到添加到永久链接的数字是 UNIX 时间戳,末尾有几个零。截至本文发布时,当前的 UNIX 时间戳为:1363035971。
我正在寻找一些关于我应该做什么的建议。我对一个 PHP 函数特别感兴趣,它会检查 url 以查看末尾是否有一串数字,如果有,则 301 将其重定向到正确的永久链接。我也会重视有关 Google 为何会找到这些错误网址以及 UNIX 时间戳是否是线索的任何输入。
【问题讨论】:
标签: wordpress http-status-code-404 unix-timestamp permalinks