【问题标题】:how to list spark-packages added to the spark context?如何列出添加到火花上下文的火花包?
【发布时间】:2017-07-05 21:38:19
【问题描述】:

是否可以列出已添加到 spark 会话中的 spark 包?

org.apache.spark.deploySparkSubmitArguments 类有一个用于包的变量:

var packages: String = null

假设这是一个 spark 包的列表,是否可以通过 SparkContext 或其他地方获得?

【问题讨论】:

    标签: apache-spark sparkr


    【解决方案1】:

    我使用以下方法检索该信息:spark.sparkContext.listJars

    例如:
    $ spark-shell --packages elsevierlabs-os:spark-xml-utils:1.4.0

    scala> spark.sparkContext.listJars.foreach(println)
    spark://192.168.0.255:51167/jars/elsevierlabs-os_spark-xml-utils-1.4.0.jar
    spark://192.168.0.255:51167/jars/commons-io_commons-io-2.4.jar
    spark://192.168.0.255:51167/jars/commons-logging_commons-logging-1.2.jar
    spark://192.168.0.255:51167/jars/org.apache.commons_commons-lang3-3.4.jar
    spark://192.168.0.255:51167/jars/net.sf.saxon_Saxon-HE-9.6.0-7.jar
    

    在这种情况下,我加载了 spark-xml-utils 包,其他 jar 包作为依赖项加载。

    【讨论】:

    • 已投赞成票,但尚未接受。答案是 scala,但我一直在寻找可以与 sparkr 一起使用的东西。
    • 我花了几个小时梳理 SparkR 文档、代码和 shell。 SparkR 实现中似乎没有直接公开此功能。我还粗略地尝试通过 sparkR.callJStatic 检索信息,但没有成功。对不起!
    • 这和答案一样好 - 即没有办法做到这一点。感谢您的帮助。
    猜你喜欢
    • 2021-09-30
    • 2012-05-31
    • 2011-01-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多