【问题标题】:What Linux Full Text Indexing Tool Has A Good C++ API?什么 Linux 全文索引工具具有良好的 C++ API?
【发布时间】:2010-12-19 02:56:54
【问题描述】:

我希望将全文索引添加到用 C++ 编写的 Linux 桌面应用程序中。我认为最简单的方法是调用现有的库或实用程序。 This article 审查可用于 Gnome 和 KDE 桌面的各种开源实用程序; metatracker、recoll 和 stigi 都是用 C++ 编写的,所以它们看起来都很合理。但是我找不到任何关于如何将它们用作库或通过 API 的值得注意的文档。相反,我可以使用CluceneXapian 之类的东西,它们是通用的全文索引库。它们看起来更简单,但如果我使用它们,我将不得不实现我自己的索引守护进程,这是一个没有吸引力的前景。

另外,Xesam 似乎是最新的东西,有人有证据证明它有效吗?

那么,有没有人有使用任何应用程序或库的经验?您是如何使用它的?哪些文档有用?

【问题讨论】:

  • lucene是Qt的第三方提供的,但是没有Public API :(

标签: c++ full-text-search kde


【解决方案1】:

进一步环顾四周后,我发现并与 Recol 合作。它相信它有最好的 C++ 接口来连接全文搜索引擎,在本例中是 Xapian。

重要的是要认识到 clucene 和 Xapian 都是主要为多用户服务器应用程序设计的高度复杂的库。将它们降低到适合客户端系统的水平并不容易。如果我没记错的话,Strigi 有一个复杂的纯 C 接口,它没有被改编。

Clucene 目前似乎也没有得到积极维护,而 Xapian 似乎也得到了维护。但问题是 recol 的存在,它允许您索引特定文件,而无需原始 Xapian 或 clucene 所需的大量设置 - 通常不需要创建自己的“词干”集,等等。

【讨论】:

    【解决方案2】:

    还有Strigi,AFAIK 与 Xesam 一起使用,是 KDE 中默认使用的。

    【讨论】:

      【解决方案3】:

      我使用了您提到的 CLucene(以及 Lucene.NET),发现它非常好。

      【讨论】:

      • 一个涉及文本输入字段自动完成的商业项目。不是网络应用程序。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-03-12
      • 1970-01-01
      相关资源
      最近更新 更多