【发布时间】:2010-10-25 20:27:18
【问题描述】:
我正在为客户部署一个替代网站,但他们不希望所有旧页面都以 404 结尾。保留旧的 URL 结构是不可能的,因为它很可怕。
所以我正在编写一个 404 处理程序,它应该查找正在请求的旧页面并永久重定向到新页面。问题是,我需要所有旧页面 URL 的列表。
我可以手动执行此操作,但如果有任何应用程序可以为我提供相对 URL 列表(例如:/page/path,而不是 http:/.../page/path),我会很感兴趣给定主页。像蜘蛛一样,但它不关心内容,只是寻找更深的页面。
【问题讨论】:
标签: web-crawler