【问题标题】:Bluemix Apache Spark MetricsBluemix Apache Spark 指标
【发布时间】:2016-08-11 12:49:01
【问题描述】:

我一直在寻找一种方法来监控 Spark on Bluemix 中的性能。我知道在 Apache Spark 项目中,他们提供了基于 Coda Hale Metrics Library 的指标服务。这允许用户向各种接收器报告 Spark 指标,包括 HTTP、JMX 和 CSV 文件。详情在这里:http://spark.apache.org/docs/latest/monitoring.html

有谁知道在 Bluemix Spark 服务中执行此操作的任何方法?理想情况下,我想将指标保存到对象存储中的 csv 文件中。

感谢您的帮助。

谢谢

索尔

【问题讨论】:

    标签: apache-spark ibm-cloud


    【解决方案1】:

    目前,我没有看到使用“Coda Hale Metrics Library”和报告作业历史记录或通过 REST API 访问信息的选项。

    但是,在 Spark 历史服务器的主页上,您可以看到 事件日志目录。它指的是您的以下用户目录:file:/gpfs/fs01/user/USER_ID/events/

    在那里我看到了 JSON(类似)格式的文件。

    【讨论】:

    • 是的,我在 Spark 历史服务器中看到了一些东西。我可以通过浏览器访问这些 JSON 数据吗?
    • JSON 文件应该反映您可以通过侧面板中的 Spark 历史服务器链接访问的相同数据。 “..通过我的浏览器”是指下载?
    • 我意识到为了通过浏览器或通过curl或其他方法访问数据,必须有一个rest-api,而没有。事件日志目录设置为/gpfs /fs01/user/USER-ID/事件。如果这类似于开源 spark,则意味着该目录中有一个事件日志。我的意思是,我可以访问该日志吗?
    • 我刚刚意识到这个目录存在于 Spark 历史服务器中,并且包含我运行的所有作业的一些详细信息。所以没必要回答这个问题。谢谢
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多