【发布时间】:2023-03-30 11:15:01
【问题描述】:
您能否强调一下 2019 年两者在架构和功能方面的主要区别?以及这些差异如何影响性能?
由于某种原因,this excellent question 被标记为基于意见。
额外问题:为什么亚马逊决定使用 Presto 作为 Athena 的引擎?还是比 Impala 好?
更新
f PrestoDB 和 Impala 相同,为什么它们的硬件要求如此不同? Presto asks 16 GB+ of RAM 而Impala asks for 128 GB+ of RAM。
【问题讨论】:
-
128 不适合堆...如果您在 Impala 文档中进一步阅读,它说只有 8 个用于堆
-
可能出于同样的原因,它推荐具有 12 个或更多磁盘的节点。 Impala 要求似乎是最高性能建议,而 Presto 更像是最低可接受水平。我玩过 Presto,让它在 2 GB 内存的节点上工作。我不推荐它,即使有 8 GB 节点,在对大型数据集进行聚合查询(计数、平均值等)时,我也会耗尽内存。 Impala 在其最低建议方面可能更加保守。此外,Presto 支持直接查询 S3 文件,这可能是他们为 AWS 选择它的原因之一。
标签: database-design olap impala presto distributed-database