【问题标题】:Django Haystack substring searchDjango Haystack 子字符串搜索
【发布时间】:2011-03-26 20:16:52
【问题描述】:

我最近在我的 django 网站中添加了搜索功能,允许雇主使用关键字搜索员工。当用户最初上传他们的简历时,我将其转换为文本,去掉停用词,然后将文本添加到该用户的 TextField 中。我将 Django-Haystack 与 Whoosh 搜索引擎一起使用。

三件事-

1) 除了我可能不会使用的额外功能之外,切换到 Solr 或 Xapian 是否有任何具体优势?

2) 在将简历转换为文本时,我基本上是自己为 pdf 编制索引。我知道 Xapian 和 Solr 都支持 .pdf 索引,但是从外观上看,Haystack 不支持。关于如何解决这个问题的任何提示?还是我应该自己继续索引它?如果是这样,我应该做的不仅仅是提供关键字的文本文件吗?

3) Whoosh 仅在关键字与自身完全匹配时才返回结果。如果用户将“数学”作为他的关键字,并且我搜索“数学”,我希望该用户出现。我无法确定 Xapian 或 Solr 是否支持这一点。想法?

感谢您的任何建议。暂时我自己会继续深入研究。

【问题讨论】:

  • 您找到问题的答案了吗?你愿意和我们分享吗

标签: django search indexing model django-haystack


【解决方案1】:

很遗憾,我的知识不足以回答您的其他问题,但是对于第 3 点。)Whoosh 实际上确实支持这一点。

您必须使用 SearchQuerySet 的自动完成功能。

这里详细介绍: http://docs.haystacksearch.org/dev/autocomplete.html

我目前正在使用 Whoosh 并自己匹配部分匹配项。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-09-25
    • 2012-04-21
    • 1970-01-01
    • 1970-01-01
    • 2013-02-12
    • 2014-07-17
    • 2012-12-29
    相关资源
    最近更新 更多