【发布时间】:2016-11-08 20:13:07
【问题描述】:
我有一个表,其中包含一个包含 xml 格式数据的列。 我想要做的是解析该列中的一些数据。 表格如下所示:
SalesID | SalesDetail
--------|------------------
403958 | <SalesCode>4</SalesCode><SalesMessage>Same day shipping to customer in TX<SalesMessage>
453324 | <SalesCode>4</SalesCode><SalesMessage>Customer complained issues at check-out <SalesMessage>
有人可以指点使用 Impala 或 Hive 来解析 SalesCode 和 SalesMessage 的数据吗?
我尝试了多个正则表达式,但没有达到我想要的效果。任何帮助,将不胜感激!
【问题讨论】:
-
你能举一个你想要的预期结果的例子吗?