【发布时间】:2016-06-17 08:10:48
【问题描述】:
我已经以伪分布式模式(machine-1)安装了hadoop 2.7.2。我想向它添加一个新的datanode以使其成为一个集群。As,但问题是两台机器都有不同的磁盘分区。
我在新数据节点(machine-2)中安装了相同版本的hadoop 2.7.2,也可以与machine-1 ssh。在google了很多网站后,都有共同的教程提到,我们必须有相同的配置文件里面/etc/hadoop/ 文件夹。
综上所述,我在 machine-1 中的现有配置是:
core-site.xml
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home1/tmp</value>
<description>A base for other temporary directories
<property>
<name>fs.default.name</name>
<value>hdfs://CP000187:9000</value>
</property>
<property>
<name>hadoop.proxyuser.vasanth.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.vasanth.groups</name>
<value>*</value>
</property>
</configuration>
hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/home1/hadoop_data/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/home1/hadoop_store/hdfs/datanode</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>
/home1是安装在 machine1 中的磁盘。Machine-2 挂载了两个磁盘,即 /hdd1 和 /hdd2。
现在,我应该在新机器 (machine-2) 上的 hdfs-site.xml 中指定什么以同时使用 hdd1 和 hdd2?
所有节点的dfs.data.dir的值是否应该相同?
machine2 上的hdfs-site.xml 是否需要dfs.namenode.name.dir 属性(因为它不是名称节点)?
我的简化问题是否也必须在从节点中复制主节点配置文件?请帮我解决这个问题..
【问题讨论】:
标签: hadoop