【发布时间】:2014-05-14 20:21:42
【问题描述】:
一个非常基本的问题,但谁能告诉我如何在 solr 中进行索引时从文档中删除特殊字符?我浏览了 Solr wiki,但找不到任何相关内容。我看到很少有像 WhiteSpaceTokenizerFactory 和 StandardTokenizerFactory 这样的标记器。我在我的 schema.xml 中使用 WhiteSpaceTokenizerFactory,但它似乎并没有解决目的。我仍然可以使用“*”和“-”等查询。
【问题讨论】:
-
您要删除哪些特殊字符?
-
@Mysterion 喜欢 *、-、?、\n 等
标签: solr indexing information-retrieval