【发布时间】:2021-10-07 11:22:14
【问题描述】:
我想使用 AWS Spectrum - 基于 S3 中的文件在 Redshift 上查询。
由于您可以选择 S3 中的文件夹或 JSON 文件,因此我选择使用 JSON 文件作为位置。
错误:
当我在文件夹中引用文件 test 时 - Redshift 可以完美运行。
当我引用引用文件 test 的 JSON file 并尝试执行在整个文件上运行的查询时,它会失败:
select count(*)
from test
错误:Unexpected end of compressed file. File may be truncated.
奇怪的是 - 如果我只查询 X 行,它可以工作:
select *
from test
limit 100;
这意味着我创建的表的列(当我创建外部表时)是正确的。我在 JSON 文件中遗漏了什么吗?以下是我的编写方式(取自 AWS Docs):
{
"entries": [
{"url":"s3://s3_bucket/SpectrumTest/test.gz", "meta": { "content_length": 4668469 } }
]
}
【问题讨论】:
标签: json amazon-web-services amazon-redshift amazon-redshift-spectrum