【发布时间】:2016-03-31 21:30:34
【问题描述】:
我对分布式处理引擎一无所知,所以很难理解它是否适合我的需求。
我在关系数据库中有一个巨大的表,用户每天都在使用它(crud 操作和搜索)。
现在有一项新任务 - 可以根据需要构建为期一两年的庞大汇总报告。并且做的很快。 过去两年的所有这些表记录都太大而无法存储在内存中,所以我应该将计算分成块,对吧?
我不想重新发明轮子,所以我的问题是, 像 Hadoop 这样的分布式处理系统是否适合这类任务?
【问题讨论】:
标签: hadoop apache-spark distributed-computing