【问题标题】:How to download dataset from amazon AWS如何从亚马逊 AWS 下载数据集
【发布时间】:2017-02-06 21:21:05
【问题描述】:

我正在尝试获取大约 1GB 的大型数据集,我主要发现大型数据集位于亚马逊网络服务中,例如 https://aws.amazon.com/datasets/google-books-ngrams/ 并声明数据可用

s3://datasets.elasticmapreduce/ngrams/books/

现在我正在尝试下载这些数据。所以为此我在 AWS 中创建了我的虚拟机。如何在我的 AWS 中下载这 2 GB 的数据,以便稍后我可以通过 scp 传输到我的本地机器??

【问题讨论】:

  • 这些文件在 S3 上。无需在 AWS 上创建服务器来下载它们。安装 AWS CLI 工具并下载它们。

标签: amazon-web-services amazon-s3 dataset


【解决方案1】:

正如 Mark B 所说,您无需在 AWS 中启动服务器即可下载这些数据集。它们在 S3 中公开托管,因此您可以使用 AWS S3 CLI 的 cp 工具将它们下载到您的本地计算机,方法是运行:

aws s3 cp --recursive s3://datasets.elasticmapreduce/ngrams/books/ local

相关文档可以在here找到。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-22
    • 2014-06-06
    相关资源
    最近更新 更多