使用 Pandas 在 python 中从 S3 读取 .h5 文件时出现 FileNotFoundError答案

【问题标题】：FileNotFoundError when reading .h5 file from S3 in python using Pandas使用 Pandas 在 python 中从 S3 读取 .h5 文件时出现 FileNotFoundError
【发布时间】：2020-04-10 12:24:01
【问题描述】：

由于某种原因，当我尝试使用 pandas.read_hdf() 方法从 S3 读取 hdf 文件时，我在输入 s3 url 时收到 FileNotFoundError。该文件肯定存在，我尝试在同一个 s3 目录中使用 pandas.read_csv() 方法和一个 csv 文件，并且有效。还有什么我需要做的吗？代码如下：

import boto3
import h5py
import s3fs
import pandas as pd

csvDataframe = pd.read_csv('s3://BUCKET_NAME/FILE_NAME.csv', key='df')
print("Csv data:")
print(csvDataframe)
dataframe = pd.read_hdf('s3://BUCKET_NAME/FILE_NAME.h5', key='df')
print("Hdf data:")
print(dataframe)

这是错误：

FileNotFoundError: File s3://BUCKET_NAME/FILE_NAME.h5 does not exist

在实际代码中，BUCKET_NAME 和 FILE_NAME 被替换为它们的实际字符串。

【问题讨论】：

标签： python pandas amazon-s3 boto3 hdf5

【解决方案1】：

请确保文件扩展名为 .h5

【讨论】：

是的。不过感谢您的回复。