【发布时间】:2018-02-23 14:44:26
【问题描述】:
我有一个场景,我们在源文件中有一个时间戳字段,并以文本格式加载到存档中,并以镶木地板格式加载到托管表中。 我们看到的区别是这两个表之间的值相差了 5 小时。
知道这是你们可以克服的问题,还是 Cloudera 的一个大问题?
请告诉我。
【问题讨论】:
-
请详细说明您的问题。这些信息不足以调试您的问题。很可能是时区问题,但有关该问题的更多详细信息将有助于准确纠正它。
-
@Eresh 请检查我的答案,如果有帮助,请点赞/接受。
-
我想更正上面的内容。 “Impala 将在时间戳上增加 5 小时,它将被视为 impala 的本地时间。”这是不正确的。 Impala 对它读取的时间戳没有任何作用。问题是 HIVE 总是希望根据机器的本地 TZ 将 TS 转换为 UTC。改变价值的是它的 HIVE,而不是 Impala。 Impala 也不会“假定 UTC”只是简单地读取写入的值。例如,如果您编写时间为 08-24-2018 11:16:00 的 TS,则 HIVE 假定本地时区基于机器,然后将其转换为 UTC 并写入。 Impala 只写 (