【发布时间】:2016-05-13 22:59:05
【问题描述】:
我有一个 csv 文件,其示例数据如下所示。
姓名,工作,薪水
-------------------------
杰克,IT,12,00 美元
-------------------------
约翰,人力资源,24,00 美元
--------------------------
当我使用此命令加载此数据时 A = LOAD '/USER/XYZ/PIG/FILENAME.CSV' USING PIGSTORAGE(',') as (NAME:chararray,JOB:chararray, Salary:chararray) ;
"$12,00" 中的逗号被视为分隔符,仅加载 $12。 有什么解决方法吗? 是否可以将薪水字段加载为整数(也忽略“$”符号)..
【问题讨论】:
-
所以你的定界符是“|”为什么不用“|”作为分隔符。
-
好吧,只是为了表示目的..我在问题中添加了一个类似结构的表格。实际上,逗号是分隔符。
标签: csv hadoop apache-pig