【发布时间】:2020-07-25 15:53:33
【问题描述】:
我想将 tsv 文件保存到 adls gen1。使用以下命令保存数据,但将行分隔符写为“\n”(LF)我想写一个行分隔符“\r\n”
df.coalesce(1).write.mode("overwrite").format("csv").options(delimiter="\t",header="true",nullValue= None,lineSep ='\r\n').save(gen1temp)
我有 400 多列和 2M 行,文件大小为 6GB。 请帮助优化 soln。
【问题讨论】:
标签: apache-spark pyspark jupyter-notebook azure-functions databricks