【发布时间】:2011-12-13 22:26:05
【问题描述】:
我在使用 regexp_extract 时遇到了一些问题:
我正在查询一个制表符分隔的文件,我正在检查的列的字符串如下所示:
abc.def.ghi
现在,如果我这样做:
select distinct regexp_extract(name, '[^.]+', 0) from dummy;
MR 作业运行,它工作,我从索引 0 得到“abc”。
但是现在,如果我想从索引 1 中获取“def”:
select distinct regexp_extract(name, '[^.]+', 1) from dummy;
Hive 失败:
2011-12-13 23:17:08,132 Stage-1 map = 0%, reduce = 0%
2011-12-13 23:17:28,265 Stage-1 map = 100%, reduce = 100%
Ended Job = job_201112071152_0071 with errors
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
日志文件说:
java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error while processing row
我在这里做错了什么吗?
谢谢, 马里奥
【问题讨论】: