【发布时间】:2017-06-29 11:35:46
【问题描述】:
我正在尝试启用对位于 s3 目录中的 CSV 文件的基本 SQL 查询。 Presto 看起来很自然(文件为 10s GB)。当我在 Presto 中进行设置时,我尝试使用 Hive 连接器创建一个表。我不清楚我是否只需要 hive 元存储来将我的表配置保存在 Presto 中,或者我是否必须先在其中创建它们。
文档表明您可以使用 Presto 而无需配置 Hive,而是使用 Hive 语法。那准确吗?我的经验是 AWS S3 无法连接。
【问题讨论】:
-
旁注:您也可以考虑使用Amazon Athena,这是 Presto 的无服务器实现。但是,目前仅在少数地区。
-
我很想使用 Amazon Athena,但它不符合我的特定用例(医疗保健)
-
我的经验是 AWS S3 无法连接。 -- 究竟是什么问题?如果您使用 IAM 角色授予 EC2 机器对 S3 的访问权限,Presto Hive 连接器开箱即用地支持 S3(至少
s3a://)。