【发布时间】:2018-09-10 14:37:41
【问题描述】:
我正在学习使用 Parquet 格式(感谢此链接 https://arrow.apache.org/docs/python/parquet.html)。 那么,我是否尝试将 Parquet 文件写入 HDFS,但它不起作用。 我有以下代码:
`import pyarrow as pa
host='my.host'
port=8020
user='username'
df = pd.DataFrame({'one': [-1, np.nan, 2.5],'two': ['foo', 'bar', 'baz'],'three': [True, False, True]}, index=list('abc'))
fs = pa.hdfs.connect(host, port, user=user)`
最后一行给了我这个错误:
"FileNotFoundError: [Errno 2] No such file or directory: 'hadoop': 'hadoop'"
我还没有找到解决这个错误的方法......所以如果有人有想法......
谢谢, 内拉
【问题讨论】:
-
你能发布完整的堆栈跟踪吗?