今天使用hive的时候需要把一个字段中的josn数据分开,于是需要用到explode()函数。网上有许多文章,但是写的复杂,在此就概括下。
表生成函数:explode:把map集合或数组array中每个键值对或数组中的每个元素都单独生成一行的形式。
explode()就是内置表生成函数(UDTF),UDTF将为每个输入行生成零个或多个输出行。

fromClause: FROM baseTable (lateralView)*
lateralView: LATERAL VIEW udtf(expression) tableAlias AS columnAlias (',' columnAlias)*

具体的代码:

select goods_id2,sale_info 
from explode_lateral_view LATERAL VIEW explode(split(goods_id,','))goods as goods_id2;

这里的explode_lateral_view就是basetable,lateral view可以使用basetable中的任意列,LATERAL VIEW explode(split(goods_id,’,’))goods这个就是虚拟表,相当于在这个表中做select,然后goods_id2就是explode()后的列的列名
hive lateral view和explode的理解
这个就是原始图。
hive lateral view和explode的理解
这个就是select后的图。

参考的博文:
https://blog.csdn.net/guodong2k/article/details/79459282
https://blog.csdn.net/SunnyYoona/article/details/62894761

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-10-15
  • 2022-12-23
  • 2021-07-06
  • 2022-12-23
  • 2021-05-17
  • 2021-06-22
猜你喜欢
  • 2021-12-05
  • 2022-12-23
  • 2021-08-25
  • 2021-09-16
  • 2021-12-01
  • 2022-12-23
  • 2022-01-02
相关资源
相似解决方案