Hadoop综合大作业
2018-05-25 21:59 AAAAAAABE 阅读(128) 评论(0) 编辑 收藏 举报
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
在user/hadoop创建文件夹EnglishWord
上传文档到user/hadoop/EnglishWord文件夹中
在hive创建表world
导入文本world并查看
.
用SQL进行词频统计并保持到表word_count
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
在user/hadoop创建文件夹EnglishWord
上传文档到user/hadoop/EnglishWord文件夹中
在hive创建表world
导入文本world并查看
.
用SQL进行词频统计并保持到表word_count
相关文章: