最近在做需求发现算周表的时候将数据存储在每个星期的周一。在国内的语法实现完全没问题,但是将相同的脚本发送给海外部署新加坡站点俄罗斯站点部署时在国内测试通过的语句。在海外部署报错语法错误,这不折磨一通,难道hive不是适合国际化的趋势吗?研究发现果不其然还真是不是兼通海内外,随着我的排查思路待我慢慢道来。
就拿今天举例子吧,且看日历
Hive对周一的写法入坑实战演练
第一种实现:就什么时间格式转换且自己自行百度转换成标准时间格式xxxx-xx-xx就ok
hive计算周一的日期;
SELECT DATE_SUB(‘2020-09-05’,CAST(DATE_FORMAT(‘2020-09-05’,‘u’) AS int)-1);
国内测试如图
Hive对周一的写法入坑实战演练
刚好对照如上日历20200831且是周一是吧。就这样百分百分百五问题的sql到了海外也是可以执行的。只不过这里的,‘u’) AS int),‘u’有问题,对于一般的Sqoop导数工具无法兼容,导致始终通不过,但在hive是可以执行的。
hive计算周一的日期第二种实现;
SELECT DATE_SUB(NEXT_DAY(‘2020-09-05’,‘MO’),7)
Hive对周一的写法入坑实战演练
来来来重点说一下这种写法,对于国内这种写法在hive中完全可以执行成功,但是在海外执行会报语法错误,因为对于不同国家的周一定义不同,国外一般将周末(周日)定为一个星期的起始元,而中国一般是周一定义为一个星期的起始元。所有’MO’),7)虽然是星期一的简写,人家就不认。所以根据语言环境的不同使用Monday这种用法会出现 周中的日无效这种错误,需要设置如下:
alter session set NLS_DATE_LANGUAGE = American;
美国就用美国,德国就用德国。
Hive对周一的写法入坑实战演练
国内Hive对周一的写法入坑实战演练反正我用的hive是2.3.2是行不通的。此法 算上个周一的方法慎用。

我看还有人将以下的语句换了一个方式也是ok的
SELECT DATE_SUB(NEXT_DAY(‘2020-09-05’,‘Monday’),7);
Hive对周一的写法入坑实战演练
还有一个神奇的写法将mo或者Monday换成对应的int类型的1-7.试一把
SELECT DATE_SUB(NEXT_DAY(‘2020-09-05’,1),7)
Hive对周一的写法入坑实战演练
看来结果证明行不通的。对于1-7这样参数并不能使用。
最后一种计算周一的方式且看这里2020-01-06这一天是周一。
Hive对周一的写法入坑实战演练
这一种写法必须传一个固定周一的日期
SELECT DATE_SUB(‘2020-09-05’,PMOD(DATEDIFF(‘2020-09-05’,‘2020-01-06’),7));Hive对周一的写法入坑实战演练
这种使用hive自带的函数解析的方式不涉及语言跨区域的都是可以使用行的通

相关文章:

  • 2021-09-14
  • 2021-06-15
  • 2021-09-19
  • 2021-12-07
  • 2022-12-23
  • 2022-12-23
  • 2021-10-13
  • 2021-11-12
猜你喜欢
  • 2021-11-26
  • 2021-08-31
  • 2021-07-20
  • 2021-12-26
  • 2021-05-26
  • 2021-06-18
  • 2022-01-14
相关资源
相似解决方案