【发布时间】:2013-09-10 15:06:09
【问题描述】:
我是 Hadoop 新手。我已经安装了 hadoop,并且能够编译和运行字数统计示例。
我需要一些关于如何进行文件操作的信息。
我有一些数据文件(a.txt、b.txt、.....),其中每个文件都有 100 行带有时间戳和读数的行。我想处理这些并为每个文件赋予价值(a- 10,b-15,....)。
主要问题是数据行的顺序对于处理很重要。
谢谢。
【问题讨论】:
-
看看 MapReduce 教程,例如developer.yahoo.com/hadoop/tutorial/module4.html.