【问题标题】:Hadoop sequential data accessHadoop 顺序数据访问
【发布时间】:2018-06-28 03:37:05
【问题描述】:

根据 Hadoop 权威指南:

HDFS 是一种文件系统,设计用于存储非常大的文件 流式或顺序数据访问模式

什么是流式或顺序数据访问?它将如何减少磁盘的寻道时间?

【问题讨论】:

    标签: hadoop hdfs


    【解决方案1】:

    这并不是 Hadoop 所特有的。

    顺序访问模式是指您按顺序(通常是从头到尾)读取数据。考虑一本书的例子。阅读小说时,您使用顺序:从第 1 页开始,然后移至第 2 页,依此类推。另一种常见模式称为随机访问。这是当您从一个地方跳到另一个地方时,甚至可能在读取数据时向后跳。对于书籍示例,请考虑字典。你不像读小说那样读它。相反,您在中间某处搜索您的单词。当您完成查找该单词时,您可能会去寻找另一个单词,该单词距离您现在打开书本的位置数百页。对应该从哪里开始阅读的搜索称为“搜索”。

    当您按顺序访问时,您只需要查找一次然后读取,直到您完成该数据。在进行随机访问时,您需要在每次想要切换到文件中的不同位置时进行查找。这可能会对硬盘驱动器的性能造成相当大的影响,因为在磁驱动器上查找非常昂贵。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-09-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多