【发布时间】:2015-12-03 18:21:16
【问题描述】:
我有一个如下所示的 XML 文件。我正在使用XMLLOader 加载 XML。它工作正常。但是,在获取值时,它会给出空值:
<mfh>
<f></f>
<sn>***</sn>
<st>****</st>
<vnr>****</vnr>
<cb>***</cb>
</mfh>
<md>
<nei>
<ne>***</ne>
<k>***</k>
<n>***</n>
</nei>
<mi>
<mts>**</mts>
<g>**</g>
<mv>
<m>***</m>
</mv>
</mi>
.....
.....
</md>
我的猪脚本如下:
REGISTER '/usr/lib/pig/piggybank.jar'
a = load '/user/root/sample.xml' using org.apache.pig.piggybank.storage.XMLLoader('mfh') as (doc:chararray);
dump input_xml;
b = foreach input_xml generate FLATTEN(REGEX_EXTRACT_ALL(doc,'<mfh>\\s*<ffv>(.*)</ffv>\\s*</mfh'));
dump required_tags;
脚本的输出如下:
它没有给出任何错误,但输出是 ()。我已经更新了 XML 文件,我想解析所有的值。
【问题讨论】:
标签: apache-pig