【发布时间】:2017-02-27 17:59:47
【问题描述】:
我正在学习 Apache Pig。我正在尝试将一些数据加载到猪中。当我在 vi 编辑器中看到 txt 文件时,我找到以下(示例)行。
[雅培、DEEDEE W 9-12 年级教师 52,122.10 0 LBOE 亚特兰大独立学校系统 2010]。
我使用以下命令将数据加载到猪关系中。
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);
但是,当我在分布式环境中对 pig 进行转储时,我发现以下结果(对于上面提到的行):
(雅培,DEEDEE W,9-12年级教师,,0.0,LBOE,亚特兰大独立 学校系统,2010)。
数字数据"52,122.10 " 似乎丢失了。
请帮忙。
【问题讨论】:
-
文件分隔符是什么?是标签吗?
-
是 Murali ,它是制表符分隔的。
-
尝试使用 PigStorage('\t') 加载
标签: apache-pig