【发布时间】:2021-05-09 04:56:01
【问题描述】:
我有一个 spark 无法读取的 json(spark.read.json("xxx").show())
{'event_date_utc': None,'deleted': False, 'cost':1 , 'name':'Mike'}
问题似乎是 None 和 False 不在单引号下,spark 不能将它们默认为布尔值、空值甚至字符串。
我试图让我的 spark 读取一个模式,而不是通过强制这 2 列为字符串并具有相同的错误来推断。
对我来说,spark 正在尝试先读取数据,然后应用架构,然后在读取部分失败。
有没有办法告诉 spark 在不修改输入数据的情况下读取这些值?我正在使用 python。
【问题讨论】:
标签: python json apache-spark pyspark