【发布时间】:2021-01-27 23:29:23
【问题描述】:
如何使用StructType 创建数据集?
我们可以如下创建Dataset:
case class Person(name: String, age: Int)
val personDS = Seq(Person("Max", 33), Person("Adam", 32), Person("Muller",
62)).toDS()
personDS.show()
有没有办法在不使用案例类的情况下创建Dataset?
我想使用案例类和StructType 创建一个DataFrame。
【问题讨论】:
-
您是否在考虑 DataFrame?它是 spark2 中 Dataset[Row] 的别名,可以使用 StructType 创建指定架构
-
DataFrame = Dataset[Row],所以如果你知道如何创建DataFrame,你就知道如何创建数据集:)
-
@T.Gaweda ,如果您看到此方法“spark.createDataset”,则没有选项可以传递“StructType”,如果您尝试使用 DataFrame 创建数据集,您仍然需要案例类
标签: scala apache-spark apache-spark-sql