【问题标题】:Java Google Engine LibraryJava 谷歌引擎库
【发布时间】:2013-06-19 08:48:49
【问题描述】:

我想要一个 java 库,在 Google 上搜索文本并根据文本和语义相似性返回一些页面。有没有做这项工作的 API? 我自己编写了一个爬虫并从根页面搜索到特定深度,但我不知道如何输入文本作为 Google 的搜索查询。

【问题讨论】:

  • 首先,既然您正在编写自己的爬虫,我希望您的爬虫服从网站的 robots.txt。

标签: nlp information-retrieval java


【解决方案1】:

Google 提供了自定义搜索 API,您可以使用它从代码中搜索 Google。

如果您还没有 Google 帐户,则需要创建一个 Google 帐户,创建一个自定义搜索引擎,生成一个 API 密钥,然后将其用作您的请求的一部分。您可以获得 JSON 或 Atom XML 格式的结果。

这方面的文档可在https://developers.google.com/custom-search/v1/overview获得

因此没有 java 库,因此要实际调用 API,您需要使用 java.net.URLjava.net.URLConnection,或者像 jersey 附带的那样的 REST 客户端库。

【讨论】:

    猜你喜欢
    • 2012-04-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-02-12
    • 2011-05-06
    • 1970-01-01
    相关资源
    最近更新 更多