【发布时间】:2016-06-16 13:30:56
【问题描述】:
我在 HDFS 中加载了 2 列 CSV 文件。第 1 列是型号名称,第 2 列是以美元为单位的价格。 Example - Model: IE33, Price: $52678.00
当我运行以下脚本时,价格值都返回为两位数的结果示例 $52。
ultraPrice = LOAD '/user/maria_dev/UltrasoundPrice.csv' USING PigStorage(',') AS (
Model, Price);
dump ultraPrice;
我所有的价值都在 20000 美元到 60000 美元之间。不知道为什么会被截断。
如果我更改 CSV 文件并从价格值中删除 $ 一切正常,但我知道必须有更好的方法。
【问题讨论】:
标签: csv hadoop apache-pig