【发布时间】:2019-02-15 08:31:38
【问题描述】:
简介
我通过引用Link-1 编写了以下 R 代码。在这里,Sparklyr 包在 R 编程中用于从 JSON 文件中读取大量数据。但是,在创建 CSV 文件时,它显示了错误。
R 代码
sc <- spark_connect(master = "local", config = conf, version = '2.2.0')
sample_tbl <- spark_read_json(sc,name="example",path="example.json", header = TRUE,
memory = FALSE, overwrite = TRUE)
sdf_schema_viewer(sample_tbl) # to create db schema
sample_tbl %>% spark_write_csv(path = "data.csv") # To write CSV file
最后一行显示以下错误。数据集包含不同的数据类型。如果需要,我可以显示数据库模式。它包含嵌套的数据列。
错误
Error: java.lang.UnsupportedOperationException: CSV数据源不支持struct,media:array,display_url:string,expanded_url:string,id:bigint,id_str:string,indices:array,media......
问题
如何解决这个错误?是由于不同的数据类型还是深层 2 到 3 嵌套列?任何帮助将不胜感激。
【问题讨论】:
标签: r apache-spark sparklyr