【问题标题】:web based data visualization application with back end spark?带有后端 Spark 的基于 Web 的数据可视化应用程序?
【发布时间】:2017-02-14 07:52:32
【问题描述】:

我正在寻找一种数据可视化工具,它是开源的,并使用 apache Spark 作为后端。我做了一些研究,可以缩小到 Apache Zeppelin,在那里我可以根据创建的表生成图表/图形等在 Spark SQL 中,但这是我的问题,会有非技术用户查看数据视觉效果,我认为他们不会知道如何编写 SQL 等。所以我想看看是否有人知道更好的方法/ tool.Something 可以让他们拖放并且根本不需要编码,最小的学习曲线。请建议。

谢谢 普雷迪普

【问题讨论】:

  • 您有一些已经使用过的基于 SQL 的工具吗?如果是,那么您可以运行 Spark JDBC Server 并通过您的工具连接到它

标签: apache-spark data-visualization apache-zeppelin bigdata


【解决方案1】:

这可能无法完全满足您的需求。

有一些用于拖放支持的商业工具。

  • 表格
  • Tibco Spotfire
  • SAS 可视化分析

问题是用户友好的拖放工具的构建成本非常高。

如果我们有一个由数据工程师精心设计的 Zeppelin 笔记本,具有类似的功能。

  • 加载数据以触发

  • Dynamic Form探索数据的一段话

  • 发布结果

那么也许已经可以解决大量的用例了。

基于修改代码比写代码容易得多。假设我们有以下代码在 zeppelin 笔记本中使用spark-highcharts 分析和绘制图表。

import org.apache.spark.sql.functions._
import com.knockdata.spark.highcharts._
import com.knockdata.spark.highcharts.model._

highcharts(bank
  .series("x" -> "age", "y" -> avg(col("balance")))
  .orderBy(col("age"))).plot()

然后我们可以有一个简短的指导,例如

有列maritaljobeducation...可以用来代替age

有函数sum,min,max...来代替avg

【讨论】:

    【解决方案2】:

    我强烈建议你可以试试这个网站https://rawgraphs.io; 这个在线工具对我很有帮助。它基于当今非常流行的 D3js。但是,过程超级简单,上传你的数据,选择样式,然后拖动属性。网络会生成 svg、png 和 pdf 文件供您下载。

    【讨论】:

      猜你喜欢
      • 2013-01-12
      • 2012-12-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-03-04
      • 2014-07-30
      • 2012-12-17
      相关资源
      最近更新 更多