【发布时间】:2017-04-14 04:42:41
【问题描述】:
所以基本上我使用 mapreduce 来计算我保存在 hadoop 中的文本文件的字数,现在我想查看输出。
目前这是我在网上看到的唯一命令:
bin/hadoop fs -cat output/part-r-00000 | sort -k 2 -n -r | less
到目前为止,我只是对这个命令感到困惑,它只是对输出进行排序吗?我可以查看输出而不对其进行排序吗?
此命令是否按字母顺序排序 wordcount 显示所有内容?您是否有其他方法可以推荐对保存的文本文件进行排序,一本小说?
我也可以只查看wordcount的输出文件而不对其进行排序吗?
【问题讨论】:
标签: sorting hadoop output word-count