【问题标题】:What is the difference between HDFS and NTFS and FAT32?HDFS与NTFS和FAT32有什么区别?
【发布时间】:2013-07-29 19:16:53
【问题描述】:

为什么在Hadoop中使用称为HDFS的特定文件系统? HDFS 相对于 NTFS 或 FAT 的优势是什么? hadoop选择HDFS的原因是什么?

【问题讨论】:

  • 这可能是任何像样的 HDFS 教程都会告诉你的第一件事。
  • 鉴于 Windows 2012R2 现在具有可在多个集群节点上普遍使用的集群共享卷,虽然它可能无法扩展到数千个,但对于较小的集群,它看起来可能是一个可行的替代方案。而 2012R2 中较新的 ReFS 文件系统甚至可能比 NTFS 更适合。

标签: hadoop


【解决方案1】:

... 因为 NTFS 和 FAT 不是分布式的。 HDFS的优势就在于它。

请参阅HDFS Introduction

【讨论】:

  • 有了 CSV,NTFS 和 ReFS 现在可以在多个系统之间直接共享。
  • @Brain2000 是的,尽管我认为 HDFS 在设计上是本质上可集群的。任何东西都可以用足够多的层进行集群:HDFS 是有目的的集群的。
  • 是的。我是第一次看 Hadoop。我觉得这是一件直截了当的夹克,只针对大数据仓库,让中型项目不走运。如果 Hadoop 可以在具有较小条带大小的 NTFS 上使用,我觉得它可能对中型项目有用。
  • @Brain2000 一般来说,“中”(不知道这里是什么意思)并不真正需要它——你说得对,它专门用于大东西。
  • @Stefan 那相关部分。
【解决方案2】:

我想知道 HDFS 是不是

a) ntfs 和 ext4 等文件系统的直接替代品(“我是否必须格式化硬盘驱动器才能设置 HDFS 节点并且会丢失所有现有数据?”)

b) 安装在底层文件系统之上。

在寻找答案时发现了这个 SO 问题。

嗯,是b)

HDFS 不是一个实际的文件系统,但它使用 API 访问 底层文件系统。Yahoo 使用 ext3 作为 hadoop 的基础文件系统 部署。

相关问题和文章:

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-08-09
    • 2015-06-20
    • 1970-01-01
    • 2012-09-21
    • 1970-01-01
    • 1970-01-01
    • 2012-02-20
    • 2019-01-30
    相关资源
    最近更新 更多