【问题标题】:Lucene Tokenizer with LookAhead带有 LookAhead 的 Lucene 标记器
【发布时间】:2011-09-28 03:01:29
【问题描述】:

谁能指出我使用 LookAhead 实现 Lucene Tokenizer 的正确方向?

我正在使用雪球词干分析器,我希望能够获取城市名称的短语并防止它们被词干,这样“洛杉矶”将被设置为单个标记,而不是“”的两个标记洛杉矶”和“天使”。

我还需要将不匹配任何城市名称的标记保留为单个单词。

有什么想法吗?

TIA

【问题讨论】:

    标签: java lucene tokenize lookahead


    【解决方案1】:

    Here 是我写的东西的要点,它可以满足您的需求。

    【讨论】:

    • 优秀我将它移植到 Java 中,它就像一个魅力!谢谢你:)
    猜你喜欢
    • 2014-06-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-03-03
    相关资源
    最近更新 更多