【发布时间】:2021-03-04 23:42:41
【问题描述】:
我正在尝试使用 Azure RBAC 来保护对存储 blob 的访问,并使用 Azure Identity 从 Apache Spark 访问这些 blob。我看到最新版本的 Hadoop-Azure 支持 abfs,它支持一些令牌提供程序:https://hadoop.apache.org/docs/current/hadoop-azure/abfs.html#Azure_Managed_Identity。对于生产用途,我可以将服务主体与 AD 应用程序以及关联的客户端 ID、机密和端点一起使用。或者我什至可以使用托管身份。
在本地开发时,最好能够使用 DeviceCodeCredential 或 InteractiveBrowserCredential 之类的东西来做同样的事情,即让用户使用浏览器登录到 Azure,并使用返回的凭据来获取访问令牌将其传递给 Spark。我想要这样做的原因是让用户在访问数据时使用他们自己的凭据,而不是让存储密钥/SAS 令牌/等飞来飞去。
这样的事情可能吗?我可以实现一个包装 Azure Identity 实例的自定义令牌提供程序,但我想知道是否有更简单的方法。
【问题讨论】:
标签: apache-spark azure-active-directory