【发布时间】:2019-11-15 03:21:12
【问题描述】:
我们希望使用 azure search 提供的语言特定分析器,但添加来自 Lucene 的 html_char 过滤器。我们的想法是构建一个自定义分析器,它使用与例如 en.microsoft 分析器相同的组件(标记器、过滤器),但添加了额外的字符过滤器。
遗憾的是,我们找不到任何关于 en.microsoft 分析器或任何其他 Microsoft 分析器的确切构成的文档。我们不知道使用哪些标记器或过滤器来获得与自定义分析器相同的结果。
谁能指出我们正确的文档?
文档说 en.microsoft 分析器 performs lemmatization instead of stemming 但我找不到任何声称仅使用词形还原词干分析器的标记器或过滤器。
【问题讨论】:
-
投票结束的人:这是一个有关如何以编程方式与 Azure 搜索交互的相关且格式正确的问题。请不要关闭它。 @samy 我不知道答案,但我会找到知道的人。
-
谢谢@布鲁斯!我希望它们是可定制的。