让我们使用 mtcars 数据集并将其移动到本地 spark 实例以作为示例:
library(sparklyr)
library(dplyr)
sc <- spark_connect(master = "local")
tbl_cars <- dplyr::copy_to(sc, mtcars, "mtcars")
现在您有很多选择,这里有 2 个,每个都略有不同 - 根据您的需要进行选择:
1.将第一行收集到R中(现在是标准的R数据框),查看str:
str(tbl_cars %>% head(1) %>% collect())
2.调用schema方法,查看结果:
spark_dataframe(tbl_cars) %>% invoke("schema")
这将给出如下内容:
StructType(StructField(mpg,DoubleType,true), StructField(cyl,DoubleType,true), StructField(disp,DoubleType,true), StructField(hp,DoubleType,true), StructField(drat,DoubleType,true), StructField(wt,DoubleType,true), StructField(qsec,DoubleType,true), StructField(vs,DoubleType,true), StructField(am,DoubleType,true), StructField(gear,DoubleType,true), StructField(carb,DoubleType,true))