【问题标题】:What languages, frameworks, and technologies have you used to implement document searching?您使用了哪些语言、框架和技术来实现文档搜索?
【发布时间】:2010-05-04 14:00:05
【问题描述】:

我在一家新公司工作,我们的目标之一是为我们的团队和客户实施文档搜索门户。我有点担心,如果我们在云中使用 Salesforce 或其他一些 ECM 等外部服务提供商,将来会有很多集成工作。从客户的角度来看,这些文档也将与我们的结构化内容存在于同一个存储桶中(存储在数据库中,而不是 MS Word 文档中)。

如果您实现了文档搜索,您使用了哪些语言、框架和技术?你有失败的故事吗?我使用开箱即用的东西没有问题,但我认为我们控制文档和访问它们的 API 很重要。如果我们完全自定义,我想使用 Rails。

【问题讨论】:

    标签: ruby-on-rails document-management ecm


    【解决方案1】:

    根据您的许可需求,Lucene (LGPL) 和 Xapian (GPL) 都是出色、成熟、快速的搜索引擎 API,具有多种语言的绑定。我已经成功地使用了这两种方法。

    【讨论】:

    • Lucene 可能是 OSS 文档索引的“标准”。
    • 好点。但我正在考虑更进一步,使用 Nuxeo 或 Alfresco 作为我们的后端公共存储库。我想我想知道这是否有点矫枉过正,而 Lucene 是更灵活的方式。只是不想重新发明轮子......
    【解决方案2】:

    Lucene 可能是最安全的选择,因为它被广泛使用并且相当不错。

    从 Lucene 中受益的最简单方法可能是使用 Alfresco,它安装起来很容易,并且默认具有 Lucene。这意味着您只需要安装 Alfresco,将您的文档放入存储库,您就可以使用强大的网络搜索界面搜索您的文档。

    如果你需要以编程方式搜索,我的建议是使用 Alfresco 的CMIS 接口,它可以让你以 REST 方式进行搜索。 JCR API 也可用。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-10-23
      • 2017-10-25
      • 2010-09-15
      • 1970-01-01
      • 2010-10-09
      • 1970-01-01
      • 2010-09-12
      • 1970-01-01
      相关资源
      最近更新 更多