- 一、impala介绍
- 二、impala-shell语法
一、impala介绍
impala是什么
1、impala是cloudera提供的一款高效率的sql查询工具,提供实时的查询效果,官方测试性能比hive快10到100倍,其sql查询比sparkSQL还要更加快速,号称是当前大数据领域最快的查询sql工具。
2、基于hive并使用内存进行计算,兼顾数据仓库,具有实时,批处理,多并发等优点。
impala架构
impala-server:启动的守护进程,执行我们的查询计划,从节点,官方建议与所有的datanode装在一起,可以通过hadoop的短路读取特性实现数据的快速查询
impala-statestore:状态存储区 ,主节点
impalas-catalog:元数据管理区 ,主节点