【问题标题】:How to read parquet file from AWS S3 bucket using R without downloading it locally?如何使用 R 从 AWS S3 存储桶读取镶木地板文件而不在本地下载?
【发布时间】:2020-06-29 12:18:51
【问题描述】:

我可以从本地的 AWS S3 存储桶下载 parquet 文件,然后从中读取(参见下面的代码)。但是有什么方法可以直接从 S3 读取 parquet 文件并读取,而不存储在本地?

save_object("Financial_Sample.parquet", file = "Financial_Sample.parquet", bucket = 'my-bucket')
df <- read_parquet("Financial_Sample.parquet")```

【问题讨论】:

    标签: r amazon-s3 parquet


    【解决方案1】:

    看一下箭头包:https://arrow.apache.org/docs/r/index.html

    它可以直接从 s3 读取,甚至可以在读取之前使用一些 dplyr 动词进行过滤。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-11-06
      • 2019-12-07
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-12-28
      • 1970-01-01
      • 2019-10-27
      相关资源
      最近更新 更多