【发布时间】:2017-01-24 14:07:40
【问题描述】:
在 EMR 客户端模式和集群模式下,纱线中的 Spark 流式 Java 自定义接收器问题。
以下是问题。
当我们在 EMR 集群(纱线)上运行 spark 流的 JavaCustomReceiver 时,它会随机将侦听器绑定到执行器之一。所以我们所要做的就是,将所有传入的流量转移到它随机选择的那个 ip。
当执行器失败时,情况会变得更糟。重新启动后,它尝试在另一个执行器上绑定侦听器,再次随机选择。我们必须再次将传入流量转移到新选择的节点。
我的问题是: 1. 我们不能在我们选择的特定执行者上绑定监听器吗? (修复 ip 以便侦听器绑定) 如果不... 2. 无论如何我们可以通过程序知道它在哪个执行器上重新启动了侦听器? (因为它选择随机节点来启动该接收器) 最重要的是。 3. 驱动运行的节点可以不绑定监听吗? (在客户端模式下运行时)
仅供参考
我们已经尝试过 Receiver 超类的 preferredLocation,但我们没有同样的运气。
对此的任何帮助都非常感谢。
【问题讨论】:
标签: apache-spark spark-streaming hadoop-yarn