【问题标题】:Sqoop Export with Missing Data缺少数据的 Sqoop 导出
【发布时间】:2015-06-17 06:17:39
【问题描述】:

我正在尝试使用 Sqoop 将数据从 HDFS 导出到 Postgresql。但是,我通过导出部分收到一个错误,它无法解析输入。我手动进入要导出的文件,发现这一行缺少两列。我用 Sqoop 命令尝试了一堆不同的参数,但无法让它工作。这是我到目前为止运行的内容:

sqoop export --connect jdbc:postgresql://localhost:5432/XX -username
XX -password XX --table XX --input-fields-terminated-by
"\t" --input-lines-terminated-by "\n" --input-null-string '\n' --input-null
non-string '\n' -m 1 --export-dir /user/dan/output

我也尝试过不使用“--input-null-string”和“--input-null-non-string”参数并得到相同的结果。我的表有 6 列,并且我正在读取的文件具有制表符分隔的值,如果所有 6 列都存在,则这些值将插入表中。任何帮助将不胜感激。

【问题讨论】:

  • 尝试不使用--input-fields-terminated-by "\t" --input-lines-terminated-by "\n" --input-null-string '\n' --input-null non-string '\n'

标签: sql postgresql shell hadoop sqoop


【解决方案1】:

我通过更改我的 reduce 函数解决了这个问题,这样如果没有正确数量的字段来输出某个值,那么我就可以使用带有该值的 --input-null-non-string 和它工作。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-03-23
    • 2021-11-08
    • 2015-07-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多