【问题标题】:is there a way to visualize Spark mllib Random Forest Model?有没有办法可视化 Spark mllib 随机森林模型?
【发布时间】:2016-05-25 20:35:36
【问题描述】:

我似乎找不到一种方法来可视化我的 RF 模型,该模型是使用 Spark 的 MLLib RandomForestModel 获得的。打印为字符串的模型只是一堆嵌套的 IF 语句.. 想要像在 R 中一样进行可视化似乎很自然。我正在使用 Spark Python API 和 Java API.. 开放使用任何会产生的东西我的 RF 模型的类似 R 的可视化。

【问题讨论】:

  • 可视化随机森林模型是什么意思?如果你在 R 中有它,你在找什么? rf <- randomforest(y~., data) rf summary(rf) 我没有看到一种简单的可视化随机森林的方法。决策树是的。

标签: apache-spark apache-spark-mllib


【解决方案1】:

有一个图书馆可以帮助解决这个问题,EurekaTrees。基本上它只需要调试字符串构建一棵树,然后使用 d3.js 将其显示为网页

【讨论】:

  • 如何将一个字符串从 spark 中保存为 .txt?
  • 在python中是model.toDebugString()来获取字符串然后使用f = open('debug.txt', 'w')f.write(model.toDebugString())
  • @ForFunAndProfit - 可能是一个较晚的后续问题 - 我应该将文本转换为 .json 还是其他格式?因为我收到此错误 - AttributeError: 'NoneType' object has no attribute 'data'
【解决方案2】:

来自Databricks(2015 年 10 月): “上面列出的仅限 Scala 的图也将很快在 Python 笔记本中提供。还有其他机器学习模型可视化正在开发中。请继续关注决策树和机器学习管道可视化!”

【讨论】:

    猜你喜欢
    • 2016-01-28
    • 2019-10-07
    • 2015-12-13
    • 2018-09-23
    • 1970-01-01
    • 2015-11-14
    • 2020-08-08
    • 2019-08-11
    • 2019-11-22
    相关资源
    最近更新 更多