【发布时间】:2012-03-12 08:20:08
【问题描述】:
我正在尝试构建自己的搜索引擎进行实验。
我知道倒排索引。例如在索引单词时。
键是单词,并且有一个包含该单词的文档 ID 列表。因此,当您搜索该单词时,您会立即获得文档
如何处理多个单词
您获取每个单词的所有文档并遍历这些文档以查看是否有两个单词?
我觉得不是这样的。
任何人都知道这个问题的真正答案而不用猜测吗?
【问题讨论】:
-
如果您可以获取单词 A 的所有文档(或文档 ID)并且可以为单词 B 执行相同的操作,那么您还可以在不打开文档本身的情况下生成两个结果集的交集。
标签: search lucene full-text-search search-engine