1.集群搭建

参考:https://blog.csdn.net/qq_38038143/article/details/83050840

在已搭建的集群中,修改配置文件yarn-site.xml:
与参考文章不同的原因为:执行运算命令时命令卡住即不能进一步执行。

<configuration>

<!-- Site specific YARN configuration properties -->
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <property>
                <name>yarn.resourcemanager.webapp.address</name>
                <value>master:8099</value>
        </property>

        <property>
                <name>yarn.resourcemanager.address</name>
                <value>master:8032</value>
        </property>
        <property>
                <name>yarn.resourcemanager.scheduler.address</name>
                <value>master:8030</value>
        </property>
        <property>
                <name>yarn.resourcemanager.resource-tracker.address</name>
                <value>master:8031</value>
        </property>
</configuration>

配置完成后,开启HDFS:

start-all.sh

本次实验使用了1台master,4台slave节点。
Ubuntu+hadoop集群验证

2.目录创建

执行命令:
创建HDFS的输入、输出目录:

hdfs dfs -mkdir -p /data/wordcount
hdfs dfs -mkdir -p /output

查看:
Ubuntu+hadoop集群验证

3.验证

准备例子文件,将本地文件上传到HDFS:
Ubuntu+hadoop集群验证

hdfs dfs -put etc/hadoop/core-site.xml /data/wordcount/

运算:
计算例子文件的单词数:

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount /data/wordcount /output/wordcount

Ubuntu+hadoop集群验证

结果查看:
Ubuntu+hadoop集群验证

相关文章:

  • 2022-01-10
  • 2021-11-13
  • 2021-09-14
  • 2021-08-19
  • 2021-11-20
猜你喜欢
  • 2021-10-19
  • 2021-04-08
  • 2021-11-20
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-08-28
相关资源
相似解决方案