【问题标题】:Hadoop Map Reduce framework for Big Data analysis用于大数据分析的 Hadoop Map Reduce 框架
【发布时间】:2015-07-12 03:15:32
【问题描述】:
我选择了关于 Hadoop Map reduce 框架的研讨会主题,作为初学者,我对此知之甚少。
我的疑惑如下:-
- Job Tracker、Task Tracker 是软件还是硬件?
- 正如在其中一个示例中给出的那样,关于 map reduce 被用于查找某些(比如 3 个)文件中所有单词的出现,那么你在哪里给出查询,即在 map reduce 程序中“查找单词的出现” ?地图如何知道要做什么?
【问题讨论】:
标签:
hadoop
mapreduce
bigdata
【解决方案1】:
a) Job Tracker、Task Tracker 是软件还是硬件?
两者都是软件。 IE。在集群节点上运行的服务。
b)正如在其中一个示例中给出的那样,关于 map reduce 被用于查找某些(比如 3 个)文件中所有单词的出现,那么你在哪里给出查询,即在 map 中“查找单词的出现”减少程序? map怎么知道要做什么
没有查询语言,除非您使用的是 hive。您基本上在 Mapper 和 Reducer 类中实现您的逻辑。
【解决方案2】:
如果您想为研讨会做准备,请阅读 Hadoop 权威指南,从 2 章开始。
了解hadoop解决了什么样的问题,它的架构。
那么如果你有什么不明白的,很乐意帮助:)