【问题标题】:More search suggestions with Elasticsearch使用 Elasticsearch 提供更多搜索建议
【发布时间】:2016-08-25 00:39:46
【问题描述】:

我正在构建一个小型垂直搜索引擎,使用 Elasticsearch 作为索引器,Nutch 作为爬虫。我使用HTML 标题字段使用edge n gram 策略为 ES 构建搜索建议,认为标题字段会很好,因为它应该包含页面主题内容的相关术语,并且可以保持索引更小在搜索建议方面,可以是单个单词或短语。然而,在目前的测试中,它并没有像想象的那样工作......只是没有那么多建议出现。

目前我只使用大约 10 个站点进行测试,但最终会达到大约 500 个左右。我认为由于数据集较小(10 个站点,仅在 HTML 标题字段上),可能没有足够的术语或短语来提出好的建议,至少是短语建议。

是否建议在标题字段上使用edge n gram 策略来抓取更多网站以创建更多建议(术语和短语),或者我应该使用内容字段(显然比标题字段大得多)。

我正在尝试对此进行微调以获得更多搜索建议,尤其是短语建议,同时注意索引大小 - 这样性能就不会受到影响。有什么想法吗?

【问题讨论】:

    标签: elasticsearch search-suggestion


    【解决方案1】:

    现在人们可以说建议比搜索结果本身更重要 --- 这有点荒谬,我知道。但用户往往期望如果没有建议,就没有搜索结果。因此,请确保每个可搜索字段都正确反映在您的建议中——尤其是您的内容。并“稍后优化”!不要太早看你的表现。无论如何,500 个站点听起来并不像您会获得很多要索引的文档。您使用的是哪种硬件?

    【讨论】:

    • 用于开发,只是我本地的Ubuntu机器,但是当开发完成后,我打算使用aws。
    • 我同意你的观点,建议可能比结果更重要,至少最初是这样。你说的有道理,最好先有建议,以后再担心性能
    猜你喜欢
    • 2020-06-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-05-07
    相关资源
    最近更新 更多