【发布时间】:2017-05-08 20:12:54
【问题描述】:
假设文件“test1”有两个字段“a”和“b”。
样本值:
“嗨,你好吗”、“1”
“太热了”,“2”
注意第一条记录有 2 个逗号,并且仅使用双引号将其区分为 2 个列值。 第二条记录是有一个逗号。
如何编写一个猪脚本,它将加载具有双引号内值的文件。所以基本上想告诉Pig解释器字段值是用双引号括起来的。
类似的事情可以在 Hive 中实现,如下所示:
创建表 test1(
一个字符串
,b 字符串
);
行格式 serde 'com.bizo.hive.serde.csv.CSVSerde' 与 serdeproperties(
"separatorChar" = "\,",
"quoteChar" = "\"")
存储为文本文件;
【问题讨论】:
标签: apache-pig