【发布时间】:2015-04-07 14:47:10
【问题描述】:
我的应用程序连接到 HBase 并进行大量通信(每秒数百或数千次读取/写入)。这会极大地影响性能,可能是由于 HBase 对每个请求执行的 I/O 操作。
Doo.dle 是对我的代码的调用 - 蓝色和红色之间的差异是 HBase 消耗的时间。
目前,我只在独立模式下进行了测试,其中 HBase 使用本地文件系统存储数据。我想知道,在分布式模式下使用一个实际的 HDFS 是否可以显着提高性能,或者只是产生相同的结果。我试图在浪费太多时间来启动和运行集群之前找到线索。
我问自己的第二个问题是,是否可以将独立 HBase 配置为仅将数据保存到内存 (RAM) 而不是将其写入文件系统以进行性能测量。
【问题讨论】: