【问题标题】:How to load csv file to Hive table with \n symbols inside text columns如何在文本列中使用 \n 符号将 csv 文件加载到 Hive 表
【发布时间】:2013-10-21 08:37:49
【问题描述】:

我正在尝试将 CSV 文件加载到 Hive 表中,并且我的文件包含“\n” - 某些文本列中的回车符号。

有没有一种简单的方法可以将其导入 Hive? 我知道我可以为此编写自定义格式,但可能有更简单的方法?

更新

样本数据 (CSV) 2 行:

"1","title","some text","更详细的文本\n带有一些回车\n\n\n"
"2","title2","some text2","更详细的 text2222 \n 带有一些回车\n\n\n"

架构:

CREATE EXTERNAL TABLE train (
    id BIGINT, title string, content string, details string
)

任何帮助将不胜感激。 谢谢。

【问题讨论】:

  • 显示您想要的表格示例数据和架构
  • 我已经用这个更新了问题。

标签: csv import load hive


【解决方案1】:

步骤 1. replace \n 在本地文件中使用 trsed 的某些字符

cat filename|tr "\n" " " >>new_filename.csv

第 2 步使用 create statement 在 hive 中创建表

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-03-13
    • 1970-01-01
    • 2016-06-04
    • 2023-04-02
    • 1970-01-01
    相关资源
    最近更新 更多