【发布时间】:2014-07-11 07:01:55
【问题描述】:
我的 bash shell 需要一些帮助,这对我来说似乎很简单。我希望能够提取给定网站的所有链接并将它们打印到标准输出。我想通过我自己的脚本来完成这一切。我的目标是拥有命令并拥有网站,我将从其中提取所有链接,作为参数。到目前为止,这是我所拥有的:
cat > extract_links
卷曲 $1 | grep
如果这不是一个开始,我真的没有太多的编程经验,很抱歉。有必要使用正则表达式吗?如果有人愿意提供帮助,将非常感谢尽可能简单的代码。谢谢!
【问题讨论】:
-
用 grep 匹配链接很困难,因为锚标签可以跨越多行。如果你不是一个程序员,我建议你使用现有的工具来做这件事,而不是尝试自己编写脚本。