【发布时间】:2014-07-24 09:41:12
【问题描述】:
我有一个 json :
{"Name":"sampling","elementInfo":{"fraction":"3"},"destination":"/user/sree/OUT","source":"/user/sree/foo.txt"}
我发现我们可以将 json 加载到 PigScript 中。
A = LOAD ‘data.json’
USING PigJsonLoader();
但是如何在 Apache Pig 中解析 json
--Sampling.pig
--pig -x mapreduce -f Sampling.pig -param input=foo.csv -param output=OUT/pig -param delimiter="," -param fraction='0.05'
--Load data
inputdata = LOAD '$input' using PigStorage('$delimiter');
--Group data
groupedByAll = group inputdata all;
--output into hdfs
sampled = SAMPLE inputdata $fraction;
store sampled into '$output' using PigStorage('$delimiter');
以上是我的猪脚本。
如何在 Apache pig 中 parse json(每个元素)?
我需要将上面的 json 作为输入并解析其source,delimiter,fraction,output 并分别传入$input,$delimiter,$fraction,$output。
如何解析相同的 . 请推荐
【问题讨论】:
标签: json parsing hadoop mapreduce apache-pig