【发布时间】:2019-04-08 18:34:37
【问题描述】:
我有一个包含列的表,我可以使用该列基于表达式创建分区
我了解到 IBM 的 Big SQL 技术具有此功能。
我也知道我们可以按列在 hive 中进行分区,但是表达式呢?
在这种情况下,我正在做一个演员..它可以是任何表达式
CREATE TABLE INVENTORY_A (
trans_id int,
product varchar(50),
trans_ts timestamp
)
PARTITIONED BY (
cast(trans_ts as date) AS date_part
)
我希望记录按日期值进行分区。所以我希望当用户写一个像
这样的查询时select * from INVENTORY_A where trans_ts BETWEEN timestamp '2016-06-23 14:00:00.000' AND timestamp '2016-06-23 14:59:59.000'
查询将足够智能,可以按日期分解时间戳并仅在日期上进行过滤
【问题讨论】:
标签: hadoop hive data-partitioning