索引的原文档(Document)。

为了方便说明索引创建过程,这里特意用两个文件为例:

文件一:Students should be allowed to go out with their friends, but not allowed to drink beer.

文件二:My friend Jerry went to school to see his students but found them drunk which is not allowed.

lucene 索引流程整理笔记

 

 

结果处的索引文件:

lucene 索引流程整理笔记

 

  • Document Frequency 即文档频率,表示总共有多少篇文档包含此词(Term)。
  • Frequency 即词频率,表示每篇文档里面包含了几个词(Term)。
  • 左边是词典,右边是倒排表

相关文章:

  • 2019-09-25
  • 2022-12-23
  • 2022-12-23
  • 2021-10-27
  • 2022-12-23
  • 2022-02-07
猜你喜欢
  • 2021-08-09
  • 2021-06-03
  • 2021-07-15
  • 2021-11-15
  • 2022-12-23
  • 2022-12-23
  • 2021-05-31
相关资源
相似解决方案