Hive中与正则相关的函数有两个,regexp_extract和regexp_replace,本篇介绍regexp_extract。

官网中关于regexp_extract的介绍如下:

Hive正则——regexp_extract

参数说明:

  •     subject:待解析的字符串或者字符串类型的字段;
  •     pattern:正则表达式
  •     index:返回结果取表达式的哪一部分  默认值为1。0表示把整个正则表达式对应的结果全部返pattern1表示返回正则表达式中第一个() 对应的结果以此类推。注意:index的值不能大于pattern表达式中()的个数,否则报错。

实例1:

Hive正则——regexp_extract

实例2:

Hive正则——regexp_extract

相关文章: