【发布时间】:2013-08-21 06:18:09
【问题描述】:
【问题讨论】:
-
好吧,我已经搜索了这些,但这些解决方案并没有解决我的问题,所以我终于要求一个图书馆,它使一切变得孤单
-
所有在谷歌上找到的代码都可以完美运行,我猜你没有真正尝试过。如果你试过了,你应该检查你的防火墙规则,也许你的应用被阻止了。
【问题讨论】:
您可以为此编写自己的 scraper 工具。这是一个教程如何做到这一点http://twit88.com/blog/2008/01/06/java-writing-a-web-page-scraper-or-web-data-extraction-tool/
如果您只想下载文件,请检查此问题stackoverflow.com/questions/2302233/...。 如果您想从网页中的未知链接下载文件,请使用:jsoup.org 如果您知道页面结构,则可以使用 DOM 导航页面:jsoup.org/cookbook/extracting-data/dom-navigation
【讨论】:
使用 Java 7,试试 Java NIO。或者 Apache Commons-Lib,刚刚上线:
org.apache.commons.io.FileUtils.copyURLToFile(URL, File)
【讨论】: