官方安装指南地址:https://cwiki.apache.org/confluence/display/Hive/GettingStarted
我这里只描述了一下安装环境的伪分布式安装
安装环境:
Ubuntu Server 11.04
Jdk1.6.27
Hadoop-0.20.2
先决条件:
- 安装了JDK1.6和hadoop-0.17以上版本
- Hadoop已经启动并运行
- 在Hadoop为Hive设计几个备用目录
- hadoop fs -mkdir /tmp
- hadoop fs -mkdir /user/hive/warehouse(当数据由HIVE管理时,数据存储于此)
- hadoop fs chmod g+w /tmp
- hadoop fs chmod g+w /user/hive/warehouse
安装过程:
- 下载安装包 hive-0.7.1-bin.tar.gz
- 解压:tar -xzvf hive-0.7.1-bin.tar.gz
- 配置环境变量
(1) 执行:vi ~/.bashrc
(2) 在结尾处添加:
export HIVE_HOME=hive的解压目录
export PATH=${HIVE_HOME}/bin:${PATH}
(3) 应用设置执行:source ~/.bashrc
(4) 执行hive进入hive shell界面
我在配的时候这里出现了一个错误:
解决:
配置hadoop-0.20.2/conf/hadoop-env.sh中配置
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/home/hadoop/hadoop/hadoop-0.20.2/lib:/home/hadoop/hadoop/hive-0.7.1/lib/jline-0.9.94.jar:
再执行hive成功进入。
疑问:在解决这个问题后,又做了个一个实验,将该文件中的 export HADOOP_CLASSPATH。。。注释掉后 ,执行hive依然成功。没弄明白为什么会这样。求高手指点,万分感谢^_^
配置管理:
- hive的默认配置文件为:<install-dir>/conf/hive-default.xml
- 我们要改变配置的话,新建<install-dir>/conf/hive-site.xml,此文件中的属性会重写默认配置
查询示例(使用hadoop in action中的例子):