【发布时间】:2020-08-19 18:29:32
【问题描述】:
是否有人为 Azure 搜索创建了自定义 Apache Nutch 索引编写器?我想使用 Apache Nutch 爬虫来爬取一些网站,然后将爬取的内容推送到 Azure 搜索实例中。 Nutch 附带了一些用于其他开源搜索引擎的索引编写器和一些文件编写器,但不足为奇的是,没有针对 Azure 搜索的特定内容。
我浏览了网络并搜索了这些论坛,但没有找到 Azure 搜索的索引编写器。
我可以自己写一个,但我试图避免浪费我的 Java 技能(没有冒犯 Java,但这个小实验的投资回报率并不高)。
【问题讨论】:
-
indexer-cloudsearch 插件(用于 AWS cloudsearch)可能是编写插件的一个很好的起点。
标签: nutch azure-cognitive-search