【发布时间】:2018-04-06 10:56:57
【问题描述】:
我们正在寻找一种可行的方法来使用 OpenShift(基于 Docker)配置 Hadoop 生态系统集群。我们希望使用 Hadoop 生态系统的服务来构建集群,即 HDFS、YARN、Spark、Hive、HBase、ZooKeeper 等。
我的团队一直将 Hortonworks HDP 用于本地硬件,但现在将切换到基于 OpenShift 的基础架构。 Hortonworks Cloudbreak 似乎不适合基于 OpenShift 的基础架构。我发现 this 文章描述了将 YARN 集成到 OpenShift 中,但似乎没有更多信息可用。
在 OpenShift 上配置 Hadoop 生态系统集群的最简单方法是什么?手动添加所有服务容易出错且难以管理。我偶然发现了这些独立服务的 Docker 映像,但它无法与您使用 Hortonworks HDP 等平台获得的自动配置相媲美。任何指导表示赞赏。
【问题讨论】:
标签: hadoop bigdata openshift hortonworks-data-platform