【发布时间】:2020-05-15 07:17:45
【问题描述】:
当我在同一个数据集(s3 上完全相同的 parquet 文件)上多次运行完全相同的查询时,每次返回的结果集都略有不同。有时缺少几行或聚合数据略有偏差等。当然,查询相对复杂,有几个嵌套查询和在分区子集上运行的聚合,但我不明白为什么查询结果会有所不同。是否有我不知道的查询结果一致性类型的设置?
【问题讨论】:
-
运行查询时,表后面的 s3 数据/分区元数据没有变化?
-
您的 s3 数据/分区没有变化。
-
您能否大致证明您的查询是什么样子的?)有什么区别?)
-
我也在处理同样的问题,你已经解决了吗?
-
不,恐怕不会。我继续用不同的方法来解决这个问题。请考虑以下 Nebulastic 的回答。通常是这样。
标签: amazon-web-services amazon-s3 amazon-athena