【发布时间】:2017-09-22 05:47:46
【问题描述】:
我正在阅读有关大数据和 Hadoop 的教程,我在 HDFS 上找到了这两点
流式数据访问:读取整个数据集的时间比读取第一个数据集的延迟更重要。 HDFS 建立在一次写入和多次读取的模式之上。
&
低延迟数据访问:访问第一个数据所需时间非常短的应用程序不应使用 HDFS,因为它更重视整个数据而不是获取第一个记录的时间。
我很困惑,因为第一个说读取整个数据集的时间更重要,第二个说...不应该使用 HDFS,因为它重视整个数据
我不明白预期是什么?我是 Hadoop 新手。
【问题讨论】: