【发布时间】:2015-10-20 01:13:50
【问题描述】:
我正在现有的 Hadoop 集群上设置 R。到目前为止,我已经在集群的一个节点(EDGE 节点)部分上安装了 R rpms 和相关的库包,它按预期工作。 R rpms 是安装在集群的所有服务器上还是仅安装在库目录上 (在我的情况下是 /usr/lib64/R/library)在所有服务器上同步?
【问题讨论】:
-
目标是通过 R shell 执行 hadoop MR 作业(rmr、rhive、rhdfs 应该可以访问)。用户将仅登录 EDGE 节点。