【发布时间】:2013-12-02 08:42:44
【问题描述】:
我在这些分析器中使用 lucene 4.4 版:
worddelimeter, patternFilter, synonyms, lowercase,
stopwords, kStemFilter, shingle, trimfilter.
分析器按我使用它们的顺序列出。当我尝试添加文档时,出现以下异常:
startOffset must be non-negative, and endOffset must be >= startOffset,
startOffset=37571,endOffset=37569
此异常仅针对特定文件发生。但是,当我更改顺序并在worddelimeter 之前放置stopwords 过滤器时,它可以正常工作。但这不是正确的做法!
为什么会这样?在什么情况下,过滤器会以某种方式更改数据以导致该异常?
【问题讨论】:
-
您能否添加详细信息(例如发生这种情况的文件?)
-
另外请添加异常的整个堆栈跟踪。就目前而言,这个问题很难解决。