【发布时间】:2013-12-08 02:44:14
【问题描述】:
我正准备用 lucence 和 hadoop 制作分布式搜索模块,但对某些东西感到困惑:
众所周知,hdfs是一个分布式文件系统,当我把一个文件放到hdfs上时,文件会被分成几个块存储在claster的不同从机中,但是如果我使用lucene来写hdfs上的索引,我想看看每台机器上的索引,如何实现?
我已经阅读了一些 hadoop/contrib/index 和一些 katta,但不理解“分片,看起来像索引的一部分”的概念,它存储在一台计算机的本地磁盘上还是集群中只有一个方向分布?
感谢提前
【问题讨论】:
-
请您重写最后一句“集群中只有一个方向分布”吗?