【发布时间】:2011-02-15 07:28:20
【问题描述】:
我需要获取一长串有效 URL 来测试我的 DNS 服务器。我发现了一个包含大量链接的网页,可能会产生很多好的链接(http://www.cse.psu.edu/~groenvel/urls.html),我认为这是最简单的这样做的方法是下载 HTML 文件并简单地 grep 获取 URL。但是,我无法让它仅通过链接列出我的结果。
我知道有很多方法可以做到这一点。我并不挑剔它是如何完成的。
鉴于上面的 URL,我想要一个所有 URL 的列表(每行一个),如下所示:
http://www.cse.psu.edu/~groenvel/
http://www.acard.com/
http://www.acer.com/
...
【问题讨论】: