【发布时间】:2011-09-28 03:01:29
【问题描述】:
谁能指出我使用 LookAhead 实现 Lucene Tokenizer 的正确方向?
我正在使用雪球词干分析器,我希望能够获取城市名称的短语并防止它们被词干,这样“洛杉矶”将被设置为单个标记,而不是“”的两个标记洛杉矶”和“天使”。
我还需要将不匹配任何城市名称的标记保留为单个单词。
有什么想法吗?
TIA
【问题讨论】:
标签: java lucene tokenize lookahead
谁能指出我使用 LookAhead 实现 Lucene Tokenizer 的正确方向?
我正在使用雪球词干分析器,我希望能够获取城市名称的短语并防止它们被词干,这样“洛杉矶”将被设置为单个标记,而不是“”的两个标记洛杉矶”和“天使”。
我还需要将不匹配任何城市名称的标记保留为单个单词。
有什么想法吗?
TIA
【问题讨论】:
标签: java lucene tokenize lookahead
Here 是我写的东西的要点,它可以满足您的需求。
【讨论】: