【发布时间】:2017-02-20 06:04:24
【问题描述】:
我正在使用带有 hive 服务的 HDP 2.5。当我使用以下查询创建配置单元表时;
create table Sample_table
row format delimited
fields terminated by '|'
stored as textfile
AS
select *
from sample_table_unique
where state='AL';
我可以创建具有特定位置的外部表。
我的问题是,当我创建表/外部表时,存储的文件已被拆分,即。如下所示,明智的文件已被拆分。
/apps/hive/warehouse/sampledb/sample_table:
00000_0,
00001_0,
00002_0,
00003_0,
我不想要那些拆分的文件,我想要一个像 00000_0 这样的合并文件。我不知道它是怎么发生的。请告诉我如何解决这个问题。
【问题讨论】:
-
这是HDFS文件系统的基本概念......文件将由hdfs管理......
-
是的,我知道。但我想要单个文件。我该怎么做。
-
为什么? ..........
-
state='AL' 的数据相同。
-
为什么要一个文件?