【发布时间】:2019-07-08 12:54:57
【问题描述】:
我正在尝试基于在 GCS 中存储为镶木地板的文件实现配置单元表,路径如 gs://abc/dt=02-02-2019/hr=02(基于 UTC 的物理分区)
现在我想创建两个配置单元表,其中逻辑分区基于时区,一个用于 UTC,另一个用于 CET,我如何进行分区,以便基于日期和小时的分区根据时区选择 dt 和 hr 值。如果它还可以适应日光节约等,那就太好了。
我正在使用气流创建外部配置单元表。
【问题讨论】:
-
逻辑分区不清楚。你能提供一些例子吗
-
逻辑分区只不过是我的hive表的分区,它是物理存储的gcs,分区基于dt和hr(日期和小时基于UTC),现在我只想创建一个hive 表在此之上,但 hive 分区(dt 和 hr)应基于不同的时区,例如基于 CET
-
而时区是现有列还是可以从现有列派生?
-
我怀疑您的问题与
Airflow有很大关系。您必须将task的 convertexecution_date(我认为目前仅在UTC中)转换为CET/ 任何其他时区,然后将其传递给您的HiveDML/DDL(HQL) 声明
标签: hive airflow hive-partitions