hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。另外一个是Windows注册表文件。
#hive debug命令
nuhup hive --service hiveserver2 --debug & 1>/dev/null 2>/dev/null
#hive jdbc连接串
!connect jdbc:hive2://${hive节点ip}:${hive端口号}/${需要连接的数据库名};principal=${hive principal}
#通过代理模式连接hive
!connect jdbc:hive2://${hive节点ip}:${hive端口号}/${需要连接的数据库名};principal=${hive principal};hive.server2.proxy.user=${proxyUserName}
#hive jdbc连接串中指定代理用户、指定队列名
!connect jdbc:hive2://${hive节点ip}:${hive端口号}/${需要连接的数据库名};principal=${hive principal};hive.server2.proxy.user=${proxyUserName}?mapreduce.job.queuename=${queueName}