【问题标题】:S3 performance Best PraticesS3 性能最佳实践
【发布时间】:2020-11-30 02:39:37
【问题描述】:

我们在 AWS S3 上创建了一个数据湖,现在我们只使用了一个存储桶,我们的数据湖被一些区域划分: s3://bucket/landing/subject/table s3://bucket/raw/subject/table s3://bucket/refined/subject/table s3://bucket/staging/subject/table

因此,我正在阅读有关 s3 性能最佳实践的信息,有些人建议将数据湖划分为不同的存储桶,并在特定情况下为一张大表使用一个存储桶。 我们的数据湖现在非常小,但我们的公司正在快速发展……那么在未来没有性能问题的最佳实践是什么?

https://docs.aws.amazon.com/AmazonS3/latest/dev/optimizing-performance.html

我正在阅读有关限制的信息,但前缀是什么?

s3://bucket/landing/subject/table1 s3://bucket/landing/subject/table2

两个前缀?还是只有一个?

谢谢。

【问题讨论】:

    标签: amazon-web-services amazon-s3


    【解决方案1】:

    根据https://docs.aws.amazon.com/AmazonS3/latest/user-guide/using-folders.html

    但是,为了简化组织,Amazon S3 控制台支持文件夹概念作为对对象进行分组的一种方式。 Amazon S3 通过使用对象的共享名称前缀(即 也就是说,对象的名称以公共字符串开头)。对象名称 也称为键名。

    所以前缀将是键名中最后一个斜杠之前的所有内容。

    【讨论】:

      猜你喜欢
      • 2012-01-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-10-05
      • 2011-09-28
      • 2017-11-10
      相关资源
      最近更新 更多