【发布时间】:2019-08-12 07:13:03
【问题描述】:
我刚刚开始学习 Spark。我知道如果我们将 inferSchema 选项设置为 true,则会自动推断架构。我正在阅读一个简单的 csv 文件。如何在我的代码中不指定任何自定义模式的情况下动态推断模式。该代码应该能够为任何传入数据集构建架构。
有可能吗?
我尝试使用 readStream 并将我的格式指定为 csv,完全跳过了 inferschema 选项,但似乎无论如何我都需要提供该选项。
val ds1: DataFrame = spark
.readStream
.format("csv")
.load("/home/vaibha/Downloads/C2ImportCalEventSample.csv")
println(ds1.show(2))
【问题讨论】:
标签: scala apache-spark apache-spark-sql