【发布时间】:2013-08-09 13:00:40
【问题描述】:
我正在使用 htaccess 重写 www.mysite.com/index.php?id=# 并将其重定向到友好的 URL,例如 www.mysite.com/news。所以所有的新闻文章都会写成www.mysite.com/news/article1等。
现在,我将阻止服务器上不需要使用 robots.txt 编制索引的所有目录。由于我使用的是 cms,因此这些目录是 /core、/managers、/connectors 等。但由于www.mysite.com/news 目录实际上并不存在,而是用 htaccess 重写,因此会阻塞关闭所有目录,如 /core 等。仍然允许爬虫索引我的网站?
所以基本上我想知道的是:爬虫是否会在重写后看到我的网站网址?还是它仍然需要访问我的 cms 的其他目录,例如 /core 才能索引我的页面?
【问题讨论】:
标签: php html .htaccess web-crawler googlebot