【问题标题】:How to use Nutch API into java application?如何在 Java 应用程序中使用 Nutch API?
【发布时间】:2014-11-04 06:31:07
【问题描述】:

我想在我的 java 应用程序中使用 Nutch API 来从网站上抓取 pdf 链接以进行分析,我如何在我的 java 应用程序中使用 Nutch jar 来做到这一点?可以举个例子吗?

【问题讨论】:

  • 在这个示例 GitHub 存储库中查看它是如何完成的:github.com/yegor256/nutch-in-java 这里 Nutch 是从 Java 应用程序中使用的,而不是从命令行中使用的。

标签: java web-crawler nutch


【解决方案1】:

首先,您需要通过下载并解压 Nutch,然后通过发出命令来将 Nutch 作为服务器运行,

bin/nutch startserver

之后,您可以使用 Java 中的 RestTemplate 等 REST 客户端并调用所需的 API。以下是 Nutch 提供的所有 REST API 的文档。

https://wiki.apache.org/nutch/Nutch_1.X_RESTAPI/RunningJobsTutorial

【讨论】:

猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-04-04
  • 1970-01-01
  • 2011-10-04
  • 1970-01-01
  • 2011-08-02
  • 1970-01-01
相关资源
最近更新 更多