【发布时间】:2014-06-08 16:19:51
【问题描述】:
我正在使用 sqoop 从各种来源中提取数据,并且我注意到很多事情都可能出错。我已经多次发生某些列包含分隔符的情况,这会导致额外的不需要的行,进而导致不需要的 NULL 值。不需要的角色包括像 windows demiter 这样的坏人 \r\n 一直到 Icalandic Thorn。
处理这些问题的最佳做法是什么?
我考虑过按列选择所有内容并使用REPLACE-type 方法删除邪恶字符,但感觉应该有更好的方法。
【问题讨论】:
标签: mysql oracle postgresql hive sqoop