【问题标题】:What happens if an Impala query runs out of memory?如果 Impala 查询内存不足会怎样?
【发布时间】:2015-02-09 10:24:18
【问题描述】:

如果 Impala 查询内存不足会发生什么:

  1. Impala 守护程序会崩溃吗?
  2. 它是否写入磁盘?

详细的解释会有所帮助!

【问题讨论】:

    标签: hadoop cloudera impala


    【解决方案1】:

    这取决于 Impala 的版本及其配置方式。

    一般来说,Impala 会在内存不足时终止查询。有一个进程范围的内存限制,此时任何请求内存的查询都将被终止。还有另一个可选的,每次查询的内存限制。

    Impala 2.0 及更高版本支持“溢出”大型连接和聚合运算符,有助于避免这些内存不足的情况。

    【讨论】:

    • 我们正在考虑在 Impala 上构建一个队列系统,这将限制同时提交到集群(加入或聚合)的查询数量以避免溢出。这是个好主意吗?
    • Impala 对此有一个内置机制。见:cloudera.com/content/cloudera/en/documentation/core/v5-2-x/…
    • 如果 impala 作业在同一个集群上接近峰值内存,它会对其他作业(例如 map-reduce 作业或 hive 作业)产生什么影响?
    猜你喜欢
    • 2018-06-19
    • 2015-10-09
    • 2012-10-08
    • 1970-01-01
    • 2020-01-07
    • 2013-06-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多