Hadoop 是 Google labs 的MapReduce的一个实现,Nutch项目的全部数据处理都构建在其之上。MapReduce是一种简化的分布式编程模式,让程序可以自动在普通机器组成的集群中以并行方式分布执行。
        就如同java程序员可以不考虑内存泄露一样,MapReduce程序员也不许要关心海量数据如何被分配到多台机器上,不需要考虑机器失效的处理,不需要考虑这些机器间如何协作共同完成工作,程序员不需要什么并发处理或者分布式系统的经验,就可以进行分布式的编程。

相关文章:

  • 2021-08-01
  • 2021-05-16
  • 2021-09-20
  • 2022-02-19
  • 2021-08-25
  • 2021-09-17
  • 2021-12-19
  • 2021-10-30
猜你喜欢
  • 2022-01-18
  • 2021-11-19
  • 2021-09-26
  • 2021-12-31
  • 2021-12-20
  • 2021-12-15
相关资源
相似解决方案