【发布时间】:2020-04-01 04:14:06
【问题描述】:
在 OpenCvSerde 属性中定义转义字符时,我在 Hive 中遇到问题。按照下面的代码:
CREATE EXTERNAL TABLE IF NOT EXISTS databasename.tablename (
ColumnName1 datatype,
ColumnName2 datatype,
ColumnName3 datatype
) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
"separatorChar" = "|",
"quoteChar" = "\"",
"escapeChar" = "\r\n"
) Location '<HDFS LOCATION>' tblproperties ("skip.header.line.count"="1");
csv 文件将 '\r\n' 视为与 '\n' 相同。这在记录数量上有所不同。
请提出解决方案,以便我可以在 OpenCSVserde 属性中使用 \r\n 作为 escapeChar,或者有任何其他可能性来更改 serde 属性。 P.S 使用 org.apache.hadoop.hive.serde2.OpenCSVSerde 是必须的。 我确实通过了链接:character slash is not being read by hive on using OpenCSVSerde
但这并没有达到我的目的。
谢谢
【问题讨论】:
标签: hive