【发布时间】:2014-12-18 13:42:09
【问题描述】:
我一直在尝试获取 Spark Streaming 作业,在 EC2 实例上运行以使用 JMX 向 VisualVM 报告。
到目前为止,我有以下配置文件:
spark/conf/metrics.properties:
*.sink.jmx.class=org.apache.spark.metrics.sink.JmxSink
master.source.jvm.class=org.apache.spark.metrics.source.JvmSource
worker.source.jvm.class=org.apache.spark.metrics.source.JvmSource
driver.source.jvm.class=org.apache.spark.metrics.source.JvmSource
executor.source.jvm.class=org.apache.spark.metrics.source.JvmSource
然后我像这样开始 spark 流式传输工作: (我后来添加的 -D 位是为了远程访问 ec2 的 jmx)
终端:
spark/bin/spark-submit --class my.class.StarterApp --master local --deploy-mode client \
project-1.0-SNAPSHOT.jar \
-Dcom.sun.management.jmxremote \
-Dcom.sun.management.jmxremote.port=54321 \
-Dcom.sun.management.jmxremote.authenticate=false \
-Dcom.sun.management.jmxremote.ssl=false
【问题讨论】:
-
什么方式不工作,你可以连接吗?
-
将公共 IP 添加到 VisualVM 就我所知。我无法得到任何进一步的联系。作为 EC2 的安全组,我还打开了所有进出连接(我不确定我使用 -D 参数提供的端口是否在做某事)
-
仅针对最终会在这里寻找解决方案的其他人(查看第二个答案,而不是接受的答案):stackoverflow.com/questions/19130877/…
标签: amazon-ec2 jmx apache-spark visualvm spark-streaming