【发布时间】:2011-01-26 21:22:05
【问题描述】:
我将数据文件排列在名为日期的文件夹中。目录结构
- /data/2011/01/01
- /data/2011/01/02
等等,在每个目录中,我需要解析大约 50 个文件,我将输入作为 /data/** /** /** 输入 hadoop,以便它可以解析所有文件。我的问题是
- 如何让 hadoop 对输入进行排序。我需要按日期解析文件。
- 在解析特定日期的文件时,我需要预加载与该日期相关联的数据结构,并且位于同一日期目录中。
谢谢 安库什
【问题讨论】:
标签: hadoop