【发布时间】:2019-03-11 02:29:46
【问题描述】:
从 spark 文档中,我知道执行程序(即工作程序)用于与 master 建立连接的端口(因为默认情况下每个工作程序只有一个执行程序)是随机确定的,但是我如何设置它们的范围来发布这些端口在码头工人。此外,如果工作人员与另一个容器(不是分布式系统的一部分)建立连接,我是否需要发布工作人员将从容器中获取返回数据的端口(例如,通过 https 请求)? 请注意,我不使用 docker-compose.yml 因为我不需要将容器设置为服务,并且我想在需要时通过增加/减少客户数量来添加/删除容器。
【问题讨论】:
-
只需将所有容器放在同一个docker网络中,就不用担心暴露端口了。
-
每个worker可以有多个executor。
标签: docker apache-spark pyspark