【发布时间】:2018-02-14 06:58:54
【问题描述】:
我在从日志文件中解析字符串时遇到问题,是这样的:
"skey":"110","scp_id":"OC05","capedge":"3G"
"skey":"140","scp_id":"OC02","capedge":"3G"
"skey":"0","scp_id":"OC01","capedge":"3G"
这是我们表的预期输出
| skey | scp_id | capedge |
| 110 | OC05 | 3G |
| 140 | OC02 | 3G |
| 0 | OC01 | 3G |
我尝试使用https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 中的 parse_url 方法,但不幸的是我们的字符串不是 url 格式,有没有更好的方法呢?还是我必须为此使用 regexp_extract?
谢谢你, 加利赫
【问题讨论】:
-
您使用哪种编程语言?
-
@BijuPDais Hive,使用 HQL