【发布时间】:2020-05-13 07:01:25
【问题描述】:
假设我想在一个包含 4 个唯一单词的文档上创建一个倒排索引。
它看起来像word1 -> document, word2 -> document, word3 -> document, word4 -> document。
使用大小有限的 ehcache 缓存和陶土集群,我可以将所有四个关联分别放在缓存中。
但这是我想知道的: 缓存会保留一份文档副本还是存储其中四个?我的猜测是它将是四个序列化的副本(这对我来说是不可取的)。如果这是真的,有什么更好的方法来做到这一点?
【问题讨论】:
-
也许映射
word1 -> docId, word2 -> docId, word3 -> docId, word4 -> docId, docId -> document? (当然在单独的缓存中)
标签: java indexing ehcache terracotta inverted-index