【发布时间】:2018-10-25 01:32:46
【问题描述】:
我在一个 s3 存储桶、my_bucket 和一个深度学习 ubuntu ec2 实例中有多个 txt 和 csv 数据集。我在这个实例上使用 Jupyter 笔记本。我需要从 s3 读取数据到 Jupyter。
我在 AWS 文档和他们的论坛以及其他博客中到处搜索(几乎)。这是我能做的最好的。但是,在获得密钥(两者)重新启动实例(以及 aws)后,我仍然收到 aws_key 错误。
我想知道是否有人跑到这里,或者你有更好的主意从那里获取数据。只要不使用http(这需要公开数据),我就可以打开。谢谢。
import pandas as pd
from smart_open import smart_open
import os
aws_key = os.environ['aws_key']
aws_secret = os.environ['aws_secret']
bucket_name = 'my_bucket'
object_key = 'data.csv'
path = 's3://{}:{}@{}/{}'.format(aws_key, aws_secret, bucket_name, object_key)
df = pd.read_csv(smart_open(path))
【问题讨论】:
标签: python amazon-web-services amazon-s3 amazon-ec2 jupyter-notebook