【问题标题】:Indexing chat logs and searching them in Django索引聊天日志并在 Django 中搜索它们
【发布时间】:2012-01-08 16:36:33
【问题描述】:

我的 Django 应用程序需要能够搜索存储在另一个 Postgres 数据库(即与我的 Django 数据库不同的数据库)上的大量聊天日志。最初,网站上的用户会使用简单的全文搜索日志,但后来我们打算使用 NLP 解析这些日志。

在这种情况下,什么是更好的索引选项 - Sphinx 或 Solr?

我正在寻找一种 FOSS、可扩展性、支持 NLP 并具有良好的 Python/Django 绑定的东西,除非你们中的任何人有更好的方法/工具来实现这一点。

对不起,如果我在上面弄错了。我不熟悉实现这样的任何概念,并且正在努力尽快掌握这些概念。

【问题讨论】:

    标签: python django search full-text-search nlp


    【解决方案1】:

    还可以查看Haystack

    【讨论】:

      【解决方案2】:

      实施起来并不是完全没有痛苦的,但我认为如果你想做全文搜索,就开源实施而言,明确的答案是 Solr/Lucene。警告:我不将 Solr 与 Python 一起使用,而且我从未使用过 Sphinx。

      管道类似于从数据库中读取日志,为它们编制索引,将索引存储在任何服务器上,然后进行搜索。

      在 Lucene 索引器中添加额外/自定义的 NLP 内容非常简单。

      这个thread comparing Lucene and ElasticSearch 可能值得一看。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2011-10-12
        • 2017-07-07
        相关资源
        最近更新 更多