【问题标题】:solr suggester not returning any resultssolr 建议程序不返回任何结果
【发布时间】:2013-07-04 04:49:59
【问题描述】:

我已经按照建议者的 solr wiki 文章几乎到了这里的 T:http://wiki.apache.org/solr/Suggester。我的 solrconfig.xml 中有以下 xml:

<searchComponent class="solr.SpellCheckComponent" name="suggest"> 
     <lst name="spellchecker"> 
     <str name="name">suggest</str> 
     <str name="classname">org.apache.solr.spelling.suggest.Suggester</str> 
     <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str> 
     <str name="field">description</str> 
     <float name="threshold">0.05</float> 
     <str name="buildOnCommit">true</str> 
   </lst> 
</searchComponent> 
<requestHandler class="org.apache.solr.handler.component.SearchHandler" name="/suggest"> 
   <lst name="defaults"> 
     <str name="spellcheck">true</str> 
     <str name="spellcheck.dictionary">suggest</str> 
     <str name="spellcheck.onlyMorePopular">true</str> 
     <str name="spellcheck.count">5</str> 
     <str name="spellcheck.collate">true</str> 
   </lst> 
   <arr name="components"> 
     <str>suggest</str> 
   </arr> 
</requestHandler> 

但是,当我运行以下查询(或类似查询)时:

../suggest/?q=barbequ

我只得到以下结果xml:

<response>
   <lst name="responseHeader">
      <int name="status">0</int>
      <int name="QTime">78</int>
   </lst>
   <lst name="spellcheck">
      <lst name="suggestions"/>
   </lst>
</response>

如您所见,这不是很有帮助。有什么建议可以帮助解决这个问题?

【问题讨论】:

    标签: solr spell-checking autosuggest


    【解决方案1】:

    我能想到的几件事可能会导致这个问题:

    • 源字段(“描述”)不正确 - 确保这确实是为您的拼写检查器提供术语的字段。甚至可能该字段是不同的情况(例如,“描述”而不是“描述”)。

    • schema.xml 中的源字段设置不正确,或者正在由导致源字典无效的过滤器处理。我使用一个单独的字段来为字典播种,并使用&lt;copyfield /&gt; 将相关的其他字段复制到该字典中。

    • “烧烤”一词没有出现在至少 5% 的记录中(您已通过包含 &lt;float name="threshold"&gt;0.05&lt;/float&gt; 表明此要求),因此不包含在查找字典中

      李>
    • 在 SpellCheckComponent 中,&lt;str name="spellcheck.onlyMorePopular"&gt;true&lt;/str&gt; 设置意味着只有会产生更多结果的术语才会作为建议返回。根据 Suggester 文档,这具有不同的功能(按重量排序建议),但可能值得将其切换为 false 以查看它是否导致问题。

    我的 schema.xml 的相关部分:

    <schema>
        <types>
            <!-- Field type specifically for spell checking -->
            <fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
                <analyzer type="index">
                    <tokenizer class="solr.StandardTokenizerFactory" />
                    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                    <filter class="solr.LowerCaseFilterFactory" />
                    <filter class="solr.StandardFilterFactory" />
                </analyzer>
                <analyzer type="query">
                    <tokenizer class="solr.StandardTokenizerFactory" />
                    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
                    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                    <filter class="solr.LowerCaseFilterFactory" />
                    <filter class="solr.StandardFilterFactory" />
                </analyzer>
            </fieldType>
        </types>
        <fields>
            <field name="spell" type="textSpell" indexed="true" stored="false" multiValued="true" />
        </fields>
    
        <!-- Copy fields which are used to seed the spell checker -->
        <copyField source="name" dest="spell" />
        <copyField source="description" dest="spell" />
    <schema>
    

    【讨论】:

    • 您能否详细说明一下:根据 Suggester 文档,这具有不同的功能(按重量排序建议),但可能值得将其切换为 false 以查看它是否导致问题。
    【解决方案2】:

    问题可能是您查询的是/suggest 而不是/spell

    ../suggest/?q=barbequ

    在我的设置中,这是我传入的字符串:

    /solr/spell?q=barbequ&spellcheck=true&spellcheck.collate=true

    第一次进行拼写检查时需要包含

    &spellcheck.build=true

    顺便说一句,我在 solr 4 上运行。所以,也许 /suggest 是一个完全不同的端点,它做其他事情。如果是这样,请道歉。

    【讨论】:

      【解决方案3】:

      请检查是否在 schema.xml 中设置了 term-parameter,例如:

      <field name="TEXT" type="text_en" indexed="true" stored="true" multiValued="true" 
                         termVectors="true"
                         termPositions="true"
                         termOffsets="true"/>
      

      ...重新启动 solr 并重新索引

      【讨论】:

      • 我添加了 termVectors="true", termPositions="true" 和 termOffsets="true" 到我现有的术语参数(其他一切都是一样的)但它仍然返回与上面相同的结果.
      • 您是否重新启动并重新编制索引?您确定您的字段类型定义不会覆盖这些设置吗?可能没有继电器没有建议?
      • 是的,我重新启动并重新编制索引。我不相信它被覆盖了。我知道有很多产品可以通过 /select 查询完美返回。有没有办法仔细检查建议是否存在?另外,我也尝试过使用这种拼写检查方法:wiki.apache.org/solr/SpellCheckComponent。同样的事情 - 拼写检查节点中没有返回结果。
      • @TheBndr 你能解释一下为什么需要术语参数吗?我不认为这是正确的。谢谢
      • @TheBndr 我也想知道为什么需要术语参数?因为我也面临类似的问题。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2012-06-22
      • 1970-01-01
      • 2022-10-13
      • 2019-12-21
      • 2012-01-25
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多