【问题标题】:pd.read_json error when using in aws在 aws 中使用时出现 pd.read_json 错误
【发布时间】:2017-12-26 09:24:04
【问题描述】:

我是 aws 和 json 文件的新手。我正在尝试使用代码读取 aws 实例中的 json 文件:pd.read_json('train.json') 但我收到 ValueError 消息:

ValueError:解码数组值时发现意外字符(2)

json 文件是从 kaggle 竞赛下载的:https://www.kaggle.com/c/statoil-iceberg-classifier-challenge/data。有两列是图像数据,其中一些数字像这样“-27.878360999999998”

当我在本地计算机上运行它时,我没有收到任何错误消息。在 aws 实例(深度学习 AMI -Amazon Linux--2-0)中,我尝试使用绝对路径,但它不起作用。一件事是,我可以在该实例中使用同一行代码读取其他 json 文件。只是无法读取这个带有长数字的 json 文件。

这是数据的样子,我在本地计算机中获取数据帧。

'train.json' to dataframe

服务器中的 python、pandas 与我的本地计算机版本相同或更新。

提前致谢。

【问题讨论】:

    标签: python json pandas amazon-web-services valueerror


    【解决方案1】:

    我遇到了同样的问题,我找到的解决方法是:

    1. 使用任意解压工具解压 json.7z 文件。
    2. 这里将提取文件:'processed/data/train.json'。 此文件在我的 AWS AMI 上使用 pandas 打开时有效。

    希望这会有所帮助。

    【讨论】:

    • 也为我工作!而且上传 zip 文件而不是 json 文件要快得多。非常感谢。
    猜你喜欢
    • 2016-02-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-07-17
    • 2015-11-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多