【发布时间】:2016-07-05 14:37:25
【问题描述】:
我有以下使用 Spark 的 Python 代码:
from pyspark.sql import Row
def simulate(a, b, c):
dict = Row(a=a, b=b, c=c)
df = sqlContext.createDataFrame(dict)
return df
df = simulate("a","b",10)
df.collect()
我正在创建一个Row 对象,我想将其保存为DataFrame。
但是,我收到此错误:
TypeError: Can not infer schema for type: <type 'str'>
它出现在这一行:
df = sqlContext.createDataFrame(dict)
我做错了什么?
【问题讨论】:
标签: python apache-spark pyspark