【问题标题】:Apache Flink: Standalone Cluster tries to connect with username "flink"Apache Flink:独立集群尝试使用用户名“flink”连接
【发布时间】:2018-03-02 12:57:19
【问题描述】:

对于我的硕士论文,我正在尝试在 4 个节点上建立一个 flink 独立集群。我已经按照文档进行了工作,该文档非常简洁地解释了如何设置它。但是当我启动集群时出现警告,当我尝试运行作业时,出现相同消息的错误:

akka.pattern.AskTimeoutException: Ask timed out on [Actor[akka.tcp://flink@MYHOSTNAME:6123/user/jobmanager#-818199108]] after [10000 ms]. Sender[null] sent message of type "org.apache.flink.runtime.messages.JobManagerMessages$LeaderSessionMessage"

增加超时无效。当我在 Web UI 中打开任务管理器时,它们都具有以下模式:

akka.tcp://flink@MYHOSTNAME:33779/user/taskmanager

有没有人知道如何解决这个问题以使集群正常工作?提前致谢!

最后一件事:集群上没有用户“flink”并且不会被创建。因此,任何不告诉我我应该创建该用户的建议将不胜感激!谢谢!

【问题讨论】:

  • 不是一个完整的答案,因为我不确定 flink 如何引导,但对于 Akka 部分:flink@ 在那个 URI 不是用户名,它是演员系统名称。询问超时可能意味着形成集群时出现问题,因此无法联系到参与者,但这也可能只是表示参与者“taskmanager”响应超时时间过长。

标签: java timeout akka apache-flink


【解决方案1】:

不确定它是否仍然相关,但我这样做的方式(使用 Flink 1.5.3):

我通过以下方式设置了一个具有 3 个主 (JobManager) 和 20 个从 (TaskManager) 的 HA 独立集群。

  1. 定义您的 conf/masters 文件(主机名:每行 8081 个)
  2. 定义您的 conf/slaves 文件(每行每个任务管理器主机名)
  3. 在每台主机上的 flink-conf.yaml 中定义自己的 jobmanager.rpc.address 主机名
  4. 在每台从机的 flink-conf.yaml 中定义 jobmanager.rpc.address 为 localhost
  5. 设置 every 后,在任何主控主机上执行 bin/start-cluster.sh。

如果你需要HA,那么你需要设置一个zookeeper quorum并修改HA的相应属性(high-availability、high-availability.storageDir、high-availability.zookeeper.quorum)

【讨论】:

    猜你喜欢
    • 2019-02-12
    • 2016-02-24
    • 1970-01-01
    • 2022-07-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-05-05
    相关资源
    最近更新 更多