【问题标题】:difference between max_gram and min_gram in NGram TokenizerNGram Tokenizer 中 max_gram 和 min_gram 的区别
【发布时间】:2020-01-17 23:35:25
【问题描述】:

我目前正在尝试在 .NET 项目中配置弹性搜索索引(我是 ES 新手)。

我们正在使用 NEST 7.3.0

client.Indices.Create(lineItemIndex,
                c => c
                    .Settings(s => s
                    .Analysis(a => a
                        .Analyzers(aa => aa
                            .Custom("mynGram_analyzer",ca => ca
                            .Filters(new List<string> {"lowercase"})
                            .Tokenizer("mynGram")))
                        .TokenFilters(tf => tf
                            .NGram("mynGram", td => td
                                .MaxGram(15).MinGram(4)))))
                    .Map<ElasticSearchLineItem>(m => m
                        .Properties(ps => ps
                            .Text(ss => ss
                            .Name(na => na.LineItemName)
                            .Analyzer("mynGram")))
                        .Properties(ps => ps
                            .Keyword(kw => kw
                                .Name(na => na.LineItemId)))
                        .Properties(ps => ps
                            .Text(ss => ss
                            .Name(na => na.LineItemNumber)
                            .Analyzer("mynGram")))));

我收到以下错误:

类型:非法参数异常原因:“NGram Tokenizer中max_gram和min_gram之间的差异必须小于或等于:1但为[11]。可以通过更改[index.max_ngram_diff]索引级别来设置此限制设置。”

我了解问题所在。但我不知道在哪里设置这个 max_ngram_diff 设置。我正在尝试浏览the documentation

但他们使用 3 来表示最小值和最大值。

我还找到了一个示例,其中他们在 JSON 中有设置,可以发送到 ES,但我无法在 c# 代码中复制它。我希望有人可以帮助我。

【问题讨论】:

    标签: c# elasticsearch nest


    【解决方案1】:

    您可以通过以下方式更改此设置

    var createIndexResponse = await client.Indices.CreateAsync("index_name",
        c => c.Settings(s => s.Setting(UpdatableIndexSettings.MaxNGramDiff, 11)));
    

    希望对您有所帮助。

    【讨论】:

      猜你喜欢
      • 2020-02-02
      • 1970-01-01
      • 1970-01-01
      • 2021-07-28
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多