【问题标题】:"No data available" in Zeppelin chartsZeppelin 图表中的“无可用数据”
【发布时间】:2018-04-12 20:38:26
【问题描述】:

我在使用 Zeppelin 创建可视化时遇到问题。我有一个包含大约 6 亿条记录的数据集。它存储在 HDFS 集群中,我可以作为 Spark 数据帧加载:

%spark.pyspark
input_hdfs_path = u'hdfs://cluster-master:9000/data/CDR_*.parquet'
df = spark.read.format('parquet').load(input_hdfs_path)
df.registerTempTable("df")

我有兴趣创建关于 CDR 长度的直方图(字段 CDR_LENGTH):

%sql
select ROUND(CDR_LENGTH, -2) as duration, count(*) as count
from df
group by 1
order by 1

我确实在表格选项卡中得到了适当的结果(有两列,durationcount),但是当转到条形图选项卡(或任何其他图形选项卡)时,它只是说“没有可用的数据”。你能弄清楚我做错了什么吗?谢谢

【问题讨论】:

    标签: apache-spark-sql visualization apache-zeppelin


    【解决方案1】:

    您可以在图表按钮右侧找到settings, 然后你定义KeysGroupsValues,随心所欲。

    【讨论】:

    • 有没有办法按值对图表进行排序?我的数据不是按图表 x 轴排序的。
    猜你喜欢
    • 2018-08-20
    • 2017-10-11
    • 2021-12-25
    • 2022-01-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-02-19
    相关资源
    最近更新 更多