【发布时间】:2017-02-08 22:37:30
【问题描述】:
我正在尝试构建一个报告系统,但遇到了查询速度慢的问题,很想听听您的建议: 我应该使用哪个数据库(或任何其他大数据解决方案)来支持: - 每 15 分钟 ETL - 每天 3 亿行 - 来自 Web 应用程序的查询应在约 20 秒内返回。
目前我在 ORC 表上使用带有日期分区的 EMR,但即使在 1 个维度上使用 group by 运行查询并对度量求和,也需要超过 1 分钟。
谢谢
【问题讨论】:
-
你试过 presto 吗?它提供更快的临时查询。
标签: database database-administration emr amazon-emr