【发布时间】:2022-01-18 15:17:08
【问题描述】:
Dataframe 被提取到一个临时表中以绘制每个时间单位(1 天)的数据密度:
val dailySummariesDf =
getDFFromJdbcSource(SparkSession.builder().appName("test").master("local").getOrCreate(), s"SELECT * FROM values WHERE time > '2020-06-06' and devicename='Voltage' limit 100000000")
.persist(StorageLevel.MEMORY_ONLY_SER)
.groupBy($"digital_twin_id", window($"time", "1 day")).count().as("count")
.withColumn("windowstart", col("window.start"))
.withColumn("windowstartlong", unix_timestamp(col("window.start")))
.orderBy("windowstart")
dailySummariesDf.
registerTempTable("bank")
然后我用%sql 处理器绘制它
%sql
select windowstart, count
from bank
和
%sql
select windowstartlong, count
from bank
我得到的如下所示:
所以,我的期望是在这张图表中出现空白,因为有些日子根本没有数据。但相反,我看到它被密集地绘制,10 月的天数绘制在 8 月之后,没有显示 9 月的差距。
如何强制这些图表显示间隙并考虑实际 X 轴值?
【问题讨论】:
标签: scala apache-spark apache-spark-sql apache-zeppelin