【发布时间】:2015-09-07 08:32:26
【问题描述】:
我的工作是提高从磁盘读取大量小文件 (1KB) 以写入我们的数据库的速度。 数据库对我来说是开源的,我可以将所有代码从客户端更改为服务器。 数据库架构是,它是一个简单的主从分布式基于HDFS的数据库,如HBase。磁盘中的小文件可以插入到我们的数据库中,自动组合成更大的块,然后写入HDFS。(也可以将大文件由数据库分割成更小的块,然后写入HDFS)
改变客户端的一种方法是增加线程数。 我没有任何其他想法。或者您可以提供一些想法来进行性能分析。
【问题讨论】:
-
最后我们从分布式机器读取文件以提高速度
标签: mongodb database-design hbase database nosql