【发布时间】:2014-03-04 12:01:03
【问题描述】:
我有一个用 Hive 创建的表。它需要一个JSON 格式的数据(我已经使用SERDE 来创建它)。
我想知道是否可以从这个表中加载数据到Pig,然后进行一些转换。
这是我的 JSON 数据:
{"id":"1", "word":"2" ,"flag":1}.
你有什么线索吗?
我试过了
A = LOAD ‘data.json’
USING PigJsonLoader();
但没有成功。这是我得到的错误:
[main] 错误 org.apache.pig.tools.grunt.Grunt - 错误 1200:意外字符 ''
我转向
json_objects = LOAD 'hdfs://user/cloudera/test.json'
USING org.apache.pig.piggybank.storage.JsonLoader();
但它说:
无法解析 org.apache.pig.piggybank.storage.JsonLoader 使用 导入:[, org.apache.pig.builtin., org.apache.pig.impl.builtin.].
【问题讨论】:
标签: json hadoop apache-pig