【发布时间】:2014-11-04 06:31:07
【问题描述】:
我想在我的 java 应用程序中使用 Nutch API 来从网站上抓取 pdf 链接以进行分析,我如何在我的 java 应用程序中使用 Nutch jar 来做到这一点?可以举个例子吗?
【问题讨论】:
-
在这个示例 GitHub 存储库中查看它是如何完成的:github.com/yegor256/nutch-in-java 这里 Nutch 是从 Java 应用程序中使用的,而不是从命令行中使用的。
标签: java web-crawler nutch