参考网页:http://vampire1126.iteye.com/blog/891693

http://vampire1126.iteye.com/blog/891735

基本上是参照这个博客做下来的,然后自己实现了下。

-----------------------------------------------------正式工作------------------------------------------------------

安装软件:

VMware workstation 8

Ubuntu 10.04LTS

总体步骤:

1.安装Ubuntu,在Ubuntu中装好jdk,hadoop和ssh-server。

2.配置jdk环境变量,配置hadoop,配置ssh-key

3.单机环境运行hadoop监测是否成功

4.克隆单机hadoop环境的ubuntu,将两台ubuntu加入一个局域网

5.配置master和slave的ip,并测试是否ping通

6.在所有结点上配置相关master和slave信息

7.在slave中拷贝master和JobTracker的公钥,在JobTracker上拷贝master公约

8.启动hadoop,并用wordcount程序测试是否搭建成功

详细步骤:

1. 利用VMware安装虚拟机Ubuntu,我选择的是10.04,因为10.04是长效支持版本(long-term supported)。常规的安装过程,不累述。

Hadoop安装记录

2. 进入Ubuntu之后,选择软件源为中国的源,这里我选择了163的源。

Hadoop安装记录

3. 安装JDK

a) 在usr下新建Java文件夹,并拷贝下载好的jdk

Hadoop安装记录

b) 改变Java目录为可执行,进入Java这个目录,并执行安装。

Hadoop安装记录

4. 安装hadoop

下载hadoop并将其拷贝到usr/local文件夹下,并解压缩,然后将带版本号的文件夹重命名为hadoop。对应命令如下:

Hadoop安装记录

5. 创建hadoop的用户组,并在hadoop用户组中添加hadoop用户。

Hadoop安装记录

6. 为添加的用户提供root权限。

Hadoop安装记录

Hadoop安装记录

7. 配置Java变量

打开etc下的profile文件,在文件的后面加上环境变量。

Hadoop安装记录

Hadoop安装记录

改好后,重新启动虚拟机。

8. 重启后使用hadoop用户登录

Hadoop安装记录

检测java环境变量是否配置好

Hadoop安装记录

9. 安装ssh-server。我第一次尝试的时候是在ubuntu11.10,需要事先update一下apt-get

Hadoop安装记录

Hadoop安装记录

创建一个rsa的ssh-key

Hadoop安装记录

将生成的ssh-key加入到信任列表:

Hadoop安装记录

10. 配置hadoop

为hadoop添加java环境变量:

Hadoop安装记录

Hadoop安装记录

配置core-site.xml

Hadoop安装记录

Hadoop安装记录

(上图是我已经配置好集群之后的截图,如果需要是单机环境,将master换为localhost。)

配置mapred-site.xml

Hadoop安装记录

Hadoop安装记录

(上图是我已经配置好集群之后的截图,如果需要是单机环境,将master换为localhost。)

11. 运行测试

格式化namenode

Hadoop安装记录

为hadoop用户赋予hadoop文件夹的使用权限

Hadoop安装记录

启动hadoop

Hadoop安装记录

利用jps查看已经启动的服务

Hadoop安装记录

12. 运行wordcount程序

在tmp文件夹下添加一个文件作为测试:

Hadoop安装记录

将其上传到hdf文件系统中:

Hadoop安装记录

执行wordcount程序,并将结果上送至result

Hadoop安装记录

查看result的结果:

Hadoop安装记录

统计结果:

Hadoop安装记录

(如果还需要继续执行其余程序,应该将输出结果放到其他文件夹,否则会出现fileAlreadyExist的错误)

----------------------------------------------至此,单机模式已经匹配完成------------------------------

13. 克隆单机配置好hadoop环境的ubuntu

在VM的library中的Ubuntu点击右键,选择manage中的clone,然后按照提示做一个完整的克隆。(虚拟机需要在关闭状态)

14. 将两台Ubuntu加入到一个局域网中。

在虚拟机上点击右键,选择setting,点击Network Adapter,两台都选择同一个custom模式下同一个虚拟局域网。

Hadoop安装记录

15. 设置为其中一台为Master(因为在虚拟机中,因此随便选一台即可,之后不要混淆,实际中应选取性能强劲的为Master),极为UbuntuM,另一台为UbuntuS(Ubuntu Slave)。

分别配置两者的IP地址:

Master:Hadoop安装记录

Slave:Hadoop安装记录

并测试能否ping通过:

Master:Hadoop安装记录

Slave ping的地址是192.168.1.10

16. 在所有结点上,配置/usr/local/Hadoop,以下是配置好的截图,配置过程只需要用gedit或者vi打开该文件并配置即可。

配置hosts

Hadoop安装记录

Hadoop安装记录

分别用vi打开下面画线的文件,添加内容或者修改内容,添加和修改的内容用黄线划出

Hadoop安装记录

配置hdfs-sites文件:

Hadoop安装记录

Hadoop安装记录

17. 在slave上拷贝master的**

Hadoop安装记录

Hadoop安装记录

将这些**添加到信任列表

Hadoop安装记录

Hadoop安装记录

18.在JobTracker上拷贝master的公钥并添加到信任列表

Hadoop安装记录 Hadoop安装记录

19.删除/home/hadoop下的tmp文件夹(对所有结点)

Hadoop安装记录

20.在master上格式化namenode

Hadoop安装记录

21. 启动hadoop

Hadoop安装记录

利用jps查看已经启动的服务

Master:

Hadoop安装记录

Slave:

Hadoop安装记录

22.在master上查看系统状态

Hadoop安装记录

23.按照单机模式,利用wordcount,测试成功。

-----------------------------集群模式搭建成功---------------------

转载于:https://www.cnblogs.com/XuYankang/archive/2012/03/09/2387487.html

相关文章: