【发布时间】:2017-10-04 11:22:20
【问题描述】:
我在蜂巢中有一张桌子。结构如下:
vid varchar(2)
vname varchar(10)
如果我在配置单元中加载以下数据,
123,xyz
111,anc
21,pqr
应该在 hive 中只插入一条记录,但所有 3 条记录都应插入,并将 vid 值从 123 截断到 12 和 111 到 11。
谁能为此提供任何解决方案?
【问题讨论】:
我在蜂巢中有一张桌子。结构如下:
vid varchar(2)
vname varchar(10)
如果我在配置单元中加载以下数据,
123,xyz
111,anc
21,pqr
应该在 hive 中只插入一条记录,但所有 3 条记录都应插入,并将 vid 值从 123 截断到 12 和 111 到 11。
谁能为此提供任何解决方案?
【问题讨论】:
Hive 不会过滤可插入的数据,它只会截断列中超过定义长度的数据。对 Hive 行为存在误解。如果要限制要插入的字段,则需要使用 length() 和最大预期字段大小过滤行。
【讨论】: