【发布时间】:2015-03-27 22:14:25
【问题描述】:
我目前正在将数据导入配置单元表。当我们创建我们使用的表时
CREATE EXTERNAL TABLE Customers
(
Code string,
Company string,
FirstName string,
LastName string,
DateOfBirth string,
PhoneNo string,
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n';
因为我们的数据中有逗号。但是,我们现在发现逗号仍被视为字段分隔符,|我们用来分隔字段。有没有办法解决这个问题?我们是否必须转义数据中的每一个逗号,还是有更简单的方法来设置它?
示例数据
1|2|3|4
a|b|c|d
John|Joe|Bob, Jr|Alex
放入表格时显示为
1 2 3 4
a b c d
John Joe Bob Jr
Jr 占据了自己的专栏并将 Alex 从桌子上撞了下来。
【问题讨论】:
-
你能展示完整的
CREATE TABLE声明吗? -
@Jeremy 更新了完整的声明。可能是因为我们使用的是
ROW FORMAT DELIMITED?我已经在所有示例代码中看到了这一点,所以我一直认为它只是意味着这是查找该属性的地方,但我突然想到它可能会以某种方式触发逗号行为?不幸的是,IBM 的文档并不是最好的。 -
DDL 的分隔符部分对我来说看起来是正确的。也许这是特定于您的 BigInsights 版本的东西。
-
BigInsights 2.1.2,Hive 0.12
-
我没有使用过 BigInsights,所以很抱歉。
标签: hadoop hive biginsights