【发布时间】:2018-11-27 14:47:26
【问题描述】:
我们的设置中有一个 HDInsight 集群,我们将数据存储在 Hive 表中(数据位于 ADLS 中的外部表中,元数据位于外部元存储中,并使用 Azure 集群中的 Hive 服务进行访问)。 与其他 Azure 集群(不一定在同一个订阅中)共享此数据的最佳方式是什么?
Azure 具有服务主体的概念,因此我们需要设置 acls 以允许其他集群的服务主体访问与我们共享的配置单元表对应的 ADLS 文件夹。另外,我们集群的hiveserver2 url如何被其他Azure实例用作jdbc连接,以便他们可以查询数据?我们应该为他们提供什么集群登录才能使用我们的 HiveServer2 来查询 Hive 表中的数据?
我知道正确的做法是使用 Azure ESP 服务,但这显然是一个代价高昂的选择。
只让他们访问 ADLS 文件夹似乎也不正确,因为元数据不会用于访问数据...
【问题讨论】:
标签: azure hive azure-hdinsight