【发布时间】:2020-11-24 07:45:45
【问题描述】:
我完全开始使用 hbase 数据存储,我们目前正在迁移具有 orc 文件格式的 hive 外部文件系统。过去 2 年的数据需要转移到 hbase 表中,我看到很少使用批量加载方法 hcatalog 和 pig 使用但不是 orc 文件格式。你能帮我解决这个问题或者给我一些建议吗?这里我也提到了 Hive 表模式结构;
CREATE EXTERNAL TABLE countTbl (
client_id bigint,
count1 bigint,
inserted_at bigint,
count2 bigint,
date_time bigint,
id_dic STRUCT<id1:array<STRING>,id2:array<BIGINT>>,
partition_date string
)
partitioned by (primaryid string)
stored as orc
LOCATION 'hdfs://user/hadoop/countTbl';
【问题讨论】:
标签: hadoop hive hbase cloudera hortonworks-data-platform