【问题标题】:how to remove hive new line character from the data stored in AVRO format如何从以 AVRO 格式存储的数据中删除 hive 换行符
【发布时间】:2015-03-19 22:27:53
【问题描述】:

我有一个以 AVRO 格式保存在 Azure blob 中的数据。在执行选择查询时,我需要从数据中删除配置单元换行符。 hive 选择查询的输出不应包含 hive 换行符。我目前正在使用 regexp_replace({0}, '\t|\r\n|\n', ' ') 用空格替换换行符。但是,它不能按需要工作。

【问题讨论】:

  • 预期输出和当前输出有什么区别?

标签: hive


【解决方案1】:

您需要用其他一些字符替换该特定列中存在的换行符,如下所示

select regexp_replace(col_which_has_new_line,"\n","") from tbl;

【讨论】:

  • 如果我错了,请纠正我,但这不适用于 \r\n 案例,对吧?
【解决方案2】:

假设如果我有一个包含 AddressId、FullAddress、UpdatedDate 和 UpdatedBy 列的地址配置单元表。 现在已经存在的记录如下:

AddressId FullAddress UpdatedDate UpdatedBy 123公寓601, 2015-01-22 XYZ
XYZ 街,
XYZ

从 hive 表中选择数据后,我需要如下所示的输出:

AddressId FullAddress UpdatedDate UpdatedBy XYZ街123号公寓601号XYZ 2015-01-22 XYZ

谢谢。

【讨论】:

  • 或者我可以说我希望列地址值是单行谢谢。
  • 飞天你找到解决办法了吗?
  • 如果您要向问题添加更多信息,请更新问题或向问题添加评论。不要将其添加为答案。
猜你喜欢
  • 2016-03-19
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-03-13
  • 2010-12-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多