【发布时间】:2015-03-19 22:27:53
【问题描述】:
我有一个以 AVRO 格式保存在 Azure blob 中的数据。在执行选择查询时,我需要从数据中删除配置单元换行符。 hive 选择查询的输出不应包含 hive 换行符。我目前正在使用 regexp_replace({0}, '\t|\r\n|\n', ' ') 用空格替换换行符。但是,它不能按需要工作。
【问题讨论】:
-
预期输出和当前输出有什么区别?
标签: hive
我有一个以 AVRO 格式保存在 Azure blob 中的数据。在执行选择查询时,我需要从数据中删除配置单元换行符。 hive 选择查询的输出不应包含 hive 换行符。我目前正在使用 regexp_replace({0}, '\t|\r\n|\n', ' ') 用空格替换换行符。但是,它不能按需要工作。
【问题讨论】:
标签: hive
您需要用其他一些字符替换该特定列中存在的换行符,如下所示
select regexp_replace(col_which_has_new_line,"\n","") from tbl;
【讨论】:
假设如果我有一个包含 AddressId、FullAddress、UpdatedDate 和 UpdatedBy 列的地址配置单元表。 现在已经存在的记录如下:
AddressId FullAddress UpdatedDate UpdatedBy
123公寓601, 2015-01-22 XYZ
XYZ 街,
XYZ
从 hive 表中选择数据后,我需要如下所示的输出:
AddressId FullAddress UpdatedDate UpdatedBy XYZ街123号公寓601号XYZ 2015-01-22 XYZ
谢谢。
【讨论】: