[1]场景2:批量记录导入
[2]原因就在于写入的速度,hbase由于只维护一个主键,写入的速度要比mongodb这种要维护所有索引的数据库快多了。hbase占用两台机器能完成的事情,mongodb要占用更多的机器,每台机器按一年20000的费用,几百台下来就是一笔很大的费用。但是代价就是hbase记录下东西以后,只能事后通过全表检索或按照索引范围的方式进行整体分析,而不能对具体每个人的数据进行实时分析,Hbase更强调数据分析能力而不是实时数据查询能力,因此各有千秋吧。像用户行为分析的这种,一开始产品经理可能会具体看某一个人的数据,但是新鲜过后,只会看程序的分析结果了。因此从经济的角度出发,对于用户行为分析这种不需要实时数据的需求来说,hbase+mysql就可以用最经济的方式解决了。mongodb比较适合需要实时返回数据的大数据应用。
个人总结:
[2]中主要是提到了写入速度和费用的问题,有些话不太好理解,这里来阐述下:
①[2]中关于写入速度,可以查看[1]中的评测图
②然后再来看看阿里的云数据库的价格:
上图中右边三个都是4核8G,虽然mongodb以及Hbase都有各种数据库,但是可以看出,Mongodb贵了很多。
除非有高速实时查询需要,否则去购买很贵的mongodb是没有必要的,单价上,mongodb就比hbase贵了很多,
如果写入操作要达到一样的性能,那么根据[1]再配合负载均衡,mongodb需要的台数肯定会超过hbase,所以划不来。
因此如[2]中所言,mongodb的写入速度太低,为了维持用户体验,就会需要很多台机器,这是很不划算的。
Reference: