【发布时间】:2011-08-11 18:45:17
【问题描述】:
像 Google File System 和 Hadoop 这样的分布式文件系统不支持随机 I/O。
(不能修改之前写入的文件,只能写入和追加。)
他们为什么要设计这样的文件系统?
该设计的重要优势是什么?
P.S 我知道 Hadoop 将支持修改写入的数据。
但是他们说,它的性能会很不好。为什么?
【问题讨论】:
-
如果您针对一种特定情况进行优化,您希望该情况更快。未考虑的事情可能会在性能上受到影响。例如,我曾经用 Java 编写了一个
RowSet实现,它对 CSV 文件进行操作。我需要在那里进行随机访问,并且在查找文件的最后一行时大约比只能向前读取的BufferedReader慢四倍。
标签: file-io filesystems hadoop distributed-system gfs