【发布时间】:2012-09-21 23:35:35
【问题描述】:
据我了解,Hadoop 是一种分布式存储系统。但是我真正不明白的是,我们可以用 Hadoop 替换普通的 RDBMS(MySQL、Postgresql、Oracle)吗?或者 Hadoop 只是另一种类型的文件系统,我们可以在其上运行 RDBMS?
另外,Django 可以与 Hadoop 集成吗?通常,Web 框架(ASP.NET、PHP、Java(JSP、JSF 等))如何与 Hadoop 集成?
我对 Hadoop 与 RDBMS 有点混淆,如果有任何解释,我将不胜感激。 (对不起,我看了很多遍文档,但可能是因为我的英文知识不够,我发现文档大部分时间有点混乱)
【问题讨论】:
-
我没用过Hadoop。我刚看了头版。我认为这只是一个文件系统解决方案。它不会取代 RDBMS,并且可能无法很好地与 RDBMS 一起使用。我认为将数据库放在分布在多台机器上的逻辑驱动器上会导致严重的性能问题;如果您要尝试,则需要进行更多研究。
-
Hadoop 适用于普通的大文件并且没有索引。如果你想随机访问你需要 HBase 的数据。它们都建立在 HDFS 之上,HDFS 管理集群中的大文件。稍后我会给出更好的解释:-)
-
@romedius,我等不及了 :)。到目前为止,我读过的所有读物都让我更加困惑。