倒排索引原理

   普通的存储方式是给每个文档编一个序号 然后让这个序号对应单个文档的所有内容  如果用这样的方式查找   当需要查找某个单词的时候需要遍历所有的文档集合

   查找文档的效率会非常的慢

   2.基本倒排索引:

        在存储文档的时候不是以单个文档内容来做为一行存储的,而是先把所有的文档内容按照特定的分词器进行分词 以被切分后的单词做为一行来进行存储

        并且在最后一列保存这个被切分后的单词出倒排索引原理现的文档编号的集合

    3.完善的倒排索引

倒排索引原理

   

 

相关文章: