【问题标题】:Load JSON format table into Pig将 JSON 格式表加载到 Pig 中
【发布时间】:2014-03-04 12:01:03
【问题描述】:

我有一个用 Hive 创建的表。它需要一个JSON 格式的数据(我已经使用SERDE 来创建它)。

我想知道是否可以从这个表中加载数据到Pig,然后进行一些转换。

这是我的 JSON 数据:

{"id":"1", "word":"2" ,"flag":1}.

你有什么线索吗?


我试过了

A = LOAD ‘data.json’
USING PigJsonLoader();

但没有成功。这是我得到的错误:

[main] 错误 org.apache.pig.tools.grunt.Grunt - 错误 1200:意外字符 ''

我转向

json_objects = LOAD 'hdfs://user/cloudera/test.json' 
               USING org.apache.pig.piggybank.storage.JsonLoader();

但它说:

无法解析 org.apache.pig.piggybank.storage.JsonLoader 使用 导入:[, org.apache.pig.builtin., org.apache.pig.impl.builtin.].

【问题讨论】:

标签: json hadoop apache-pig


【解决方案1】:

您的错误的原因是该类不存在。如果您在 0.12.1 版本中运行 pig,您将在 http://pig.apache.org/docs/r0.12.1/api/org/apache/pig/piggybank/storage/package-summary.html 找到有关贡献的 piggybank 的文档

【讨论】:

    猜你喜欢
    • 2014-12-29
    • 2012-09-20
    • 1970-01-01
    • 2013-03-02
    • 2011-10-25
    • 1970-01-01
    • 2023-03-23
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多