Hadoop 顺序数据访问答案

【问题标题】：Hadoop sequential data accessHadoop 顺序数据访问
【发布时间】：2018-06-28 03:37:05
【问题描述】：

根据 Hadoop 权威指南：

HDFS 是一种文件系统，设计用于存储非常大的文件流式或顺序数据访问模式

什么是流式或顺序数据访问？它将如何减少磁盘的寻道时间？

【问题讨论】：

【解决方案1】：

这并不是 Hadoop 所特有的。

顺序访问模式是指您按顺序（通常是从头到尾）读取数据。考虑一本书的例子。阅读小说时，您使用顺序：从第 1 页开始，然后移至第 2 页，依此类推。另一种常见模式称为随机访问。这是当您从一个地方跳到另一个地方时，甚至可能在读取数据时向后跳。对于书籍示例，请考虑字典。你不像读小说那样读它。相反，您在中间某处搜索您的单词。当您完成查找该单词时，您可能会去寻找另一个单词，该单词距离您现在打开书本的位置数百页。对应该从哪里开始阅读的搜索称为“搜索”。

当您按顺序访问时，您只需要查找一次然后读取，直到您完成该数据。在进行随机访问时，您需要在每次想要切换到文件中的不同位置时进行查找。这可能会对硬盘驱动器的性能造成相当大的影响，因为在磁驱动器上查找非常昂贵。

【讨论】：