【问题标题】:FileNotFoundError when reading .h5 file from S3 in python using Pandas使用 Pandas 在 python 中从 S3 读取 .h5 文件时出现 FileNotFoundError
【发布时间】:2020-04-10 12:24:01
【问题描述】:

由于某种原因,当我尝试使用 pandas.read_hdf() 方法从 S3 读取 hdf 文件时,我在输入 s3 url 时收到 FileNotFoundError。该文件肯定存在,我尝试在同一个 s3 目录中使用 pandas.read_csv() 方法和一个 csv 文件,并且有效。还有什么我需要做的吗?代码如下:

import boto3
import h5py
import s3fs
import pandas as pd

csvDataframe = pd.read_csv('s3://BUCKET_NAME/FILE_NAME.csv', key='df')
print("Csv data:")
print(csvDataframe)
dataframe = pd.read_hdf('s3://BUCKET_NAME/FILE_NAME.h5', key='df')
print("Hdf data:")
print(dataframe)

这是错误:

FileNotFoundError: File s3://BUCKET_NAME/FILE_NAME.h5 does not exist

在实际代码中,BUCKET_NAME 和 FILE_NAME 被替换为它们的实际字符串。

【问题讨论】:

    标签: python pandas amazon-s3 boto3 hdf5


    【解决方案1】:

    请确保文件扩展名为 .h5

    【讨论】:

    • 是的。不过感谢您的回复。
    猜你喜欢
    • 1970-01-01
    • 2013-08-12
    • 2017-01-31
    • 2020-01-07
    相关资源
    最近更新 更多