【发布时间】:2015-12-25 18:03:04
【问题描述】:
预期输出为:(Hadoop definitive guide,Tom white,24.90)。
我尝试过使用Regex_Extract() 函数。但是,还没有运气。有人可以帮帮我吗?
我的脚本的输入是:
<CATALOG>
<BOOK>
<TITLE>Hadoop DEFINITIVE GUIDE</TITLE>
<AUTHOR>TOM WHITE</AUTHOR>
<COUNTRY>US</COUNTRY>
<COMPANY>CLOUDERA</COMPANY>
<PRICE>24.90</PRICE>
<YEAR>2012</YEAR>
</BOOK>
<BOOK>
<TITLE>Programming Pig</TITLE>
<AUTHOR>Alan Gates</AUTHOR>
<COUNTRY>USA</COUNTRY>
<COMPANY>Horton Works</COMPANY>
<PRICE>30.90</PRICE>
<YEAR>2013</YEAR>
</BOOK>
</CATALOG>
【问题讨论】:
-
你的 Pig 版本是什么?我猜 Rank 可以从 Pig 0.9 获得。剧本,我写的很完美。
标签: hadoop apache-pig