Managed Table(内部表/管理表)

管理表有如下特点:

  1. 表数据存储在管理表的存储目录下;
  2. 删除管理表时,元数据和表数据都会被删除;

Hive --- 表类型

External Table(外部表)

外部表特点如下:

  1. 表数据为已经在HDFS中存在的数据,外部表的目录并没有数据(相当于一个链接);
  2. 删除外部表时,只会删除元数据,并不会删除表数据;

使用场景:共享数据场景(同一份数据可能被多个工具分析使用);
Hive --- 表类型

Partitioned Table(分区表)

作用:用于提高查询速度;
原理:将数据按照分区条件分组存储,如下图所示:
Hive --- 表类型

参考:

  1. 官网地址;https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-PartitionedTables;

相关文章:

  • 2021-06-23
  • 2021-07-13
  • 2021-05-17
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2022-02-22
  • 2022-12-23
  • 2021-08-28
  • 2021-12-21
相关资源
相似解决方案