【发布时间】:2021-02-19 11:29:02
【问题描述】:
在 Athena 中创建表时,我无法使用特定文件创建表。有没有办法从给定的存储桶中选择所有以“year_2019”开头的文件?例如 s3://bucketname/prefix/year_2019*.csv
文档中说得很清楚,是不允许的。
来自: https://docs.aws.amazon.com/athena/latest/ug/tables-location-format.html
Athena 读取您在 CREATE TABLE 语句,并且不能忽略包含在 字首。创建表时,在 Amazon S3 路径中仅包含 您希望 Athena 读取的文件。使用 AWS Lambda 函数扫描文件 在源位置,删除所有空文件,并移动不需要 文件到另一个位置。
我想知道社区是否找到了一些解决方法:)
【问题讨论】:
-
您可以尝试使用所有文件创建一个表,然后在隐藏的合成
"$path"列上使用条件来过滤您想要的内容。你试过了吗?
标签: amazon-athena