数据分析之Hive篇 Hive基于Hadoop的数据仓库工具支持SQL查询功能 1、创建表 我们先创建内部表 2、Hive的复合类型数据用法:map、array、json 如何提高hive的执行效率,先将多个小文件合并 如何避免数据倾斜,使得我们提高执行效率 怎么控制reduce数量,防止它数量过大或过小 直接控制reduce数量,500就是500个reduce 相关文章: 2022-01-04 2021-10-24 2021-06-27 2021-05-18 2021-09-20 2021-10-04 2021-11-04 2021-11-28