【发布时间】:2019-05-28 14:58:33
【问题描述】:
假设我有这样的 Hive 查询:
CREATE TABLE student (key string, name string, course struct<class_name:string, class_teacher:string>)
STORED AS ORC;
由于是 ORC 文件格式,这将创建 5 个不同的列:
| key | name | course | course.class_name | course.class_teacher |
当尝试只读取course.class_name 列时,是否每次都会读取course 的两个子列?如,course.class_name 和 course.class_teacher ?据我所知,ORC 文件格式允许 Hive 仅加载查询所需的列。那么它实际上会做什么呢?
【问题讨论】:
标签: hadoop hive bigdata hiveql orc