【发布时间】:2018-06-28 03:37:05
【问题描述】:
根据 Hadoop 权威指南:
HDFS 是一种文件系统,设计用于存储非常大的文件 流式或顺序数据访问模式
什么是流式或顺序数据访问?它将如何减少磁盘的寻道时间?
【问题讨论】:
根据 Hadoop 权威指南:
HDFS 是一种文件系统,设计用于存储非常大的文件 流式或顺序数据访问模式
什么是流式或顺序数据访问?它将如何减少磁盘的寻道时间?
【问题讨论】:
这并不是 Hadoop 所特有的。
顺序访问模式是指您按顺序(通常是从头到尾)读取数据。考虑一本书的例子。阅读小说时,您使用顺序:从第 1 页开始,然后移至第 2 页,依此类推。另一种常见模式称为随机访问。这是当您从一个地方跳到另一个地方时,甚至可能在读取数据时向后跳。对于书籍示例,请考虑字典。你不像读小说那样读它。相反,您在中间某处搜索您的单词。当您完成查找该单词时,您可能会去寻找另一个单词,该单词距离您现在打开书本的位置数百页。对应该从哪里开始阅读的搜索称为“搜索”。
当您按顺序访问时,您只需要查找一次然后读取,直到您完成该数据。在进行随机访问时,您需要在每次想要切换到文件中的不同位置时进行查找。这可能会对硬盘驱动器的性能造成相当大的影响,因为在磁驱动器上查找非常昂贵。
【讨论】: