【问题标题】:MarkLogic - Enabling stemming will also search for American / British spellingMarkLogic - 启用词干提取也将搜索美式/英式拼写
【发布时间】:2020-03-12 12:03:10
【问题描述】:

MarkLogic 9.0.8.2

我们有业务需求来支持搜索查询中的美式/英式单词,例如

  • 纤维或纤维
  • 颜色或颜色

所以如果我们在数据库级别启用词干提取将解决这个问题,还是我们需要配置更多才能使其正常工作?

词干 https://docs.marklogic.com/guide/search-dev/stemming

【问题讨论】:

  • 数据是否混合了美式/英式单词,或者数据是否使用一致的语言,但您希望能够解析来自美式或英式搜索词的搜索,或两者兼而有之?
  • 感谢 MH 的回复 是的,我们混合了美式/英式单词,如果搜索其中任何一个,我们希望得到两者的结果。

标签: search marklogic stemming


【解决方案1】:

是的,在数据​​库上启用词干提取将是实现您想要做的最简单的方法。

以下是一些代码,您可以使用这些代码快速试验并验证它是否适合您:

xquery version "1.0-ml";
(: enable stemmed searches :)
import module namespace admin = "http://marklogic.com/xdmp/admin" at "/MarkLogic/admin.xqy";

let $config := admin:get-configuration()
return
  (: experiment with various settings: off, basic, advanced, decompounding :) 
  admin:database-set-stemmed-searches($config, xdmp:database("Documents"), "basic") 
  ! admin:save-configuration(.)
;

(: insert two test documents with different spelling for color :)
("color","colour") ! xdmp:document-insert("/"||.||".xml", <doc>{.}</doc>)
;

(: search and see what is returned :)
cts:search(doc(), cts:word-query("colour"))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-10-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-03-06
    • 1970-01-01
    • 2014-05-10
    • 1970-01-01
    相关资源
    最近更新 更多