【发布时间】:2015-04-07 14:18:06
【问题描述】:
我正在尝试用 pig 加载一个 json 文件。我可以成功加载文件,但是我发现了一个错误。
schema:
id,name,brand,color
数据:
{"id":2561,"name":"abc","brand":"Levis","color":"Blue"}
{"id":2562,"brand":"Adidas","color":"Black"}
{"id":2563,"name":"edf","brand":"Nike","color":"White"}
代码:
raw = LOAD '$INPUT_PATH' USING JsonLoader('
id:chararray,
name:chararray,
brand:chararray,
color:chararray
');
x = foreach raw generate id,brand;
dump x;
如果特定的 raw 不包含架构中定义的所有字段,则结果是错误的:(第二个 raw 应该是 Adidas 而不是黑色)
(2561,Levis)
(2562,Black)
(2563,Nike)
上面有什么解决方法吗?
提前致谢
【问题讨论】:
标签: json apache-pig