【发布时间】:2017-02-24 22:24:46
【问题描述】:
我对 Hadoop 框架用于将映射器输出(本地存储在映射器节点上)复制到减速器任务(不在同一节点上运行)的传输协议有一些疑问。 - 阅读一些博客,它使用 HTTP 进行 Shuffle 阶段 - 还读到 HDFS 数据传输(由 mapreduce 作业使用)是直接使用 TCP/IP 套接字完成的。 - 阅读 Hadoop The Definitive 指南中的 RPC。
任何指针/参考都会有很大帮助。
【问题讨论】:
标签: http hadoop mapreduce hdfs tcp-ip