【发布时间】:2017-02-06 21:21:05
【问题描述】:
我正在尝试获取大约 1GB 的大型数据集,我主要发现大型数据集位于亚马逊网络服务中,例如 https://aws.amazon.com/datasets/google-books-ngrams/ 并声明数据可用
s3://datasets.elasticmapreduce/ngrams/books/
现在我正在尝试下载这些数据。所以为此我在 AWS 中创建了我的虚拟机。如何在我的 AWS 中下载这 2 GB 的数据,以便稍后我可以通过 scp 传输到我的本地机器??
【问题讨论】:
-
这些文件在 S3 上。无需在 AWS 上创建服务器来下载它们。安装 AWS CLI 工具并下载它们。
标签: amazon-web-services amazon-s3 dataset