【问题标题】:Pyarrow 0.15.1 uploading empty files to HDFSPyarrow 0.15.1 将空文件上传到 HDFS
【发布时间】:2020-03-18 16:34:26
【问题描述】:

您好,我正在尝试使用 pyarrow Hadoop 文件系统接口中的上传方法将 csv 文件上传到我的 HDFS 集群:

import pyarrow as pa

fs = pa.hdfs.connect(host, port, user)
with open('test.csv') as f:
   pa.hdfs.HadoopFileSystem.upload(fs, '/data/test.csv', f)

由于某种原因,这总是将 0B 的空文件上传到 pyarrow 版本 0.15.1 中的 HDFS。但是当降级到 pyarrow 0.10.0 版本时,文件会正确上传。

我使用的是 HDFS 2.7.3 版

【问题讨论】:

    标签: upload hdfs pyarrow


    【解决方案1】:

    应该是:

    with open('test.csv','rb') as f:
    

    这可能是因为文件包含一些非 unicode 字符,需要以二进制形式读取。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-09-17
      • 2016-04-12
      • 1970-01-01
      • 2019-04-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多