【发布时间】:2019-07-05 14:15:19
【问题描述】:
我想从包含大量文件的文件夹gs://bundle_name/folder_name/ 中获取第一个和最后一个文件(基于Last modified 时间戳)。 gsutil 或 Cloud API 似乎不支持它。
【问题讨论】:
标签: google-cloud-platform google-cloud-storage gsutil google-cloud-sdk
我想从包含大量文件的文件夹gs://bundle_name/folder_name/ 中获取第一个和最后一个文件(基于Last modified 时间戳)。 gsutil 或 Cloud API 似乎不支持它。
【问题讨论】:
标签: google-cloud-platform google-cloud-storage gsutil google-cloud-sdk
您要求对只想存储文件的产品进行昂贵的操作。它不是一个数据库,它意味着可大规模扩展,因此您不会看到本机支持此操作。考虑改为使用数据库记录所有文件的时间,并查询数据库以查找相关文件而不是存储系统。
【讨论】:
+1 到这里的另一个答案。服务本身不支持此功能,但您可以使用客户端库(或 gsutil,如果您想做一些快速-n-dirty 正则表达式解析)来列出所需前缀下的所有文件,然后遍历它们并跟踪最新和最旧的条目(或您想要应用的任何过滤标准)。这个问题非常接近 this gsutil GitHub issue 的重复,我在其中提供了一个示例 Bash 脚本来执行类似的操作。
【讨论】: