【发布时间】:2019-05-23 17:07:24
【问题描述】:
我的客户在安装在 AWS EMR 上的 Jupyterhub 上配置了一个 AD 连接器,这样不同的用户将通过 AD 在 jupyterhub 上进行身份验证。目前的理解是,当不同的用户通过 Jupyterhub 上的 Jupyter notebook 提交自己的 spark 作业到共享底层 EMR spark 引擎时,spark 作业会通过 Livy 提交到 spark 引擎。每个 Livy 会话都会有一个相关的 spark 会话映射到它(这是我目前的理解,如果我错了,请纠正我)
问题是不同的 Jupyterhub 用户是共享 相同 Livy 会话(然后是不同 spark 会话)还是不同的 Livy 会话(然后是不同的 spark 会话)?
我能找到的唯一有限的材料是:
https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-jupyterhub.html
提前非常感谢!
【问题讨论】:
-
取决于您是否设置了用户模拟,请参阅docs.aws.amazon.com/emr/latest/ReleaseGuide/…