【问题标题】:Noise Removal using Lucene 4.8使用 Lucene 4.8 去噪
【发布时间】:2014-06-13 07:53:41
【问题描述】:

我找不到任何使用 Lucene 4.8 从文本中删除停用词的示例。你能告诉我如何使用类 StopFilter 和 StopAnalyzer 类来实现这一点。

【问题讨论】:

    标签: lucene noise


    【解决方案1】:

    三个StandardAnalyzer 构造函数中的两个允许指定停用词;只需使用其中任何一个。这个分析器在下面使用StopFilter,你不需要做任何额外的事情。

    【讨论】:

    • 这对我没有帮助。它没有任何停用词删除代码。
    • 请重新阅读我的回答。链接中的示例代码使用StandardAnalyzer,可以配置停用词。
    猜你喜欢
    • 2014-01-07
    • 2012-07-03
    • 2018-12-24
    • 1970-01-01
    • 2011-08-16
    • 2019-11-13
    • 1970-01-01
    • 1970-01-01
    • 2022-10-21
    相关资源
    最近更新 更多