【问题标题】:AWS Glue as Hive DatasourceAWS Glue 作为 Hive 数据源
【发布时间】:2021-05-24 16:05:14
【问题描述】:

我读过 AWS Glue 是一个与 Hive 兼容的数据存储,但我还没有找到如何将 AWS Glue 用作 JDBC 数据源。

我想使用 AWS Glue 目录作为我的报告来源,如 Hive 文档所示 - https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-ConnectionURLforRemoteorEmbeddedMode

Connection URL for Remote or Embedded Mode
The JDBC connection URL format has the prefix jdbc:hive2:// and the Driver class is org.apache.hive.jdbc.HiveDriver. Note that this is different from the old HiveServer.

For a remote server, the URL format is jdbc:hive2://<host>:<port>/<db>;initFile=<file> (default port for HiveServer2 is 10000).
For an embedded server, the URL format is jdbc:hive2:///;initFile=<file> (no host or port).

当我在 AWS Glue 中编辑数据库时,我似乎可以为客户端设置一个位置 - 但我不确定在此处放置什么,也没有看到任何有关其工作原理的文档。

有什么想法吗?

【问题讨论】:

  • 您尝试过通过 JDBC 连接到 Athena 吗?您可以通过 Athena 访问 Glue 目录

标签: hive aws-glue aws-glue-data-catalog


【解决方案1】:

AWS Glue 是 Hive 元数据存储,而不是 Hive 服务器。

不过,Hive 服务器可以使用 Glue 作为元数据存储。
https://aws.amazon.com/emr/features/hive/

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-11-09
    • 1970-01-01
    • 1970-01-01
    • 2019-01-29
    • 1970-01-01
    • 1970-01-01
    • 2019-02-18
    • 2019-02-23
    相关资源
    最近更新 更多