【发布时间】:2013-07-22 09:55:05
【问题描述】:
我有一个搜索应用程序,由于文档的性质,用户经常在搜索词中包含(相关)标点符号。这通常会导致结果估计与实际过滤后的结果计数大不相同。
鉴于我知道我将要运行的搜索的性质,我想做的是配置通用索引以反映这一点。在这种情况下,我从不想要运行不区分标点符号的搜索,因此似乎将 ML 配置为包含标点符号作为“单词字符”以构建其术语列表将使估计匹配实际匹配更接近。
我还没有找到任何配置 ML 来构建通用索引的方法(我假设会有“快速标点敏感搜索”选项);我什至尝试使用标点符号敏感排序规则创建一个单词词典,希望 ML 将其用作如何配置其术语列表生成的提示,但没有骰子。
在理想情况下,我可以配置两个术语列表;一个对标点敏感,一个不敏感,但就本问题而言,只需在两者之间进行选择就足够了。
这样的事情可能吗?
【问题讨论】:
-
您能否添加更多关于什么样的搜索需要标点敏感的详细信息,为什么?理想情况下,您可以共享一些示例 XML 和查询,以说明为什么此特定内容对标点符号敏感。
标签: marklogic