【发布时间】:2015-05-01 15:19:26
【问题描述】:
我正在使用 HIVE 导入文件(它使用 sql 类型语法)并试图找出我的输入文件的变量类型,它需要是一个正则表达式,可能是以下任何一种:
- 文字
- 长
- 双
- 日期
到目前为止,我已经完成了:
只限长:^(^\\d*$)
仅限双人:(\\d{0,2}\\.\\d{1,2})
仅限日期:\\d{2}\/\\d{2}\/\\d{4}
但问题在于文本。
我认为如果上述任何一个条件不匹配,那么它就是一个 Text 并且这样做了:
文本:([^(^\\d*$)][^(\\d{2}\/\\d{2}\/\\d{4}])
但这仅匹配文本的一部分(即如果值包含“更新”,则上述表达式仅返回“更新”)。我不明白为什么它只是字符串的一部分。
【问题讨论】:
标签: sql regex types hive pattern-matching