1. master和worker并不知道他们执行了什么,他们只是在执行
  2. 用户并不知道分布式具体是怎么实现的,对他而言写好map、reduce即可
  3. mapreduce是不与具体任务耦合的
  4. map、reduce就只是一个函数,他们有他们自己的返回值,仅此而已
  5. shufflesmapreduce-碎碎念:
  6. GFS和Mapreduce混用减少了网络流量,尽量在同一台机器上使用、存储数据
  7. GFS的特性使得输出的结果需要备份,这也是一大笔流量
    mapreduce-碎碎念:

相关文章:

  • 2021-05-10
  • 2021-06-03
  • 2021-04-12
  • 2022-02-23
  • 2022-01-24
  • 2021-06-13
  • 2021-12-21
猜你喜欢
  • 2021-07-03
  • 2021-05-04
  • 2021-09-08
  • 2021-11-05
相关资源
相似解决方案