【发布时间】:2015-11-08 18:39:28
【问题描述】:
tbschema.json 看起来像这样:
[{"TICKET":"integer","TRANFERRED":"string","ACCOUNT":"STRING"}]
我使用以下代码加载它
>>> df2 = sqlContext.jsonFile("tbschema.json")
>>> f2.schema
StructType(List(StructField(ACCOUNT,StringType,true),
StructField(TICKET,StringType,true),StructField(TRANFERRED,StringType,true)))
>>> df2.printSchema()
root
|-- ACCOUNT: string (nullable = true)
|-- TICKET: string (nullable = true)
|-- TRANFERRED: string (nullable = true)
当我希望元素按照它们在 JSON 中出现的顺序时,为什么要对架构元素进行排序。
数据类型integer在导出JSON后转换为StringType,如何保留数据类型。
【问题讨论】:
标签: python json apache-spark pyspark apache-spark-sql