【发布时间】:2015-06-29 00:16:00
【问题描述】:
短篇小说:
我希望 Wget 命名下载的文件,因为它们匹配正则表达式令牌 ([^/]*)
wget -r --accept-regex="^.*/([^/]*)/$" $MYURL
全文:
我使用 GNU Wget 递归下载特定 WordPress 网站下的特定文件夹。我使用正则表达式只接受帖子而不接受其他任何内容。以下是我的使用方法:
wget -r --accept-regex="^.*/([^/]*)/$" $MYURL
它有效,Wget 遵循所有所需的 URL。但是,它将文件保存为.../last_directory/index.html,但我希望将这些文件保存为last_directory.html(.html 部分是可选的)。
有没有办法单独使用 Wget 来做到这一点?或者您会建议如何使用sed 或类似工具做同样的事情?
【问题讨论】:
标签: regex sed web-crawler wget