【发布时间】:2018-12-26 17:28:35
【问题描述】:
尝试为spark数据流的writeStream函数创建一个测试,如下所示:
SparkSession spark = SparkSession.builder().master("local").appName("spark
session").getOrCreate()
val lakeDF = spark.createDF(List(("hi")), List(("word", StringType, true)))
lakeDF.writeStream
.trigger(Trigger.Once)
.format("parquet")
.option("checkpointLocation", checkpointPath)
.start(dataPath)
但我收到以下异常: org.apache.spark.sql.AnalysisException: 'writeStream' 只能在流数据集/DataFrame 上调用;
我是 Spark 流式传输的新手,请告诉我如何创建流式传输数据帧/将上述常规数据帧转换为我的测试套件的流式传输数据帧。
【问题讨论】:
标签: scala apache-spark spark-streaming