【发布时间】:2019-07-05 15:04:22
【问题描述】:
我在 PyCharm venv 中使用 Python 3.6 解释器,并尝试将 CSV 转换为 Parquet。
import pandas as pd
df = pd.read_csv('/parquet/drivers.csv')
df.to_parquet('output.parquet')
错误 1 ImportError:无法找到可用的引擎;尝试使用:'pyarrow'、'fastparquet'。 parquet 支持需要 pyarrow 或 fastparquet
解决方案-1 安装了 fastparquet 0.2.1
错误 2 文件“/Users/python parquet/venv/lib/python3.6/site-packages/fastparquet/compression.py”,第 131 行,在 compress_data (算法,排序(压缩))) RuntimeError: 压缩 'snappy' 不可用。选项:['GZIP', '未压缩']
我安装了 python-snappy 0.5.3 但仍然出现同样的错误?我需要安装任何其他库吗?
如果我使用 PyArrow 0.12.0 引擎,我不会遇到此问题。
【问题讨论】:
标签: python pandas fastparquet