【发布时间】:2019-07-06 18:37:32
【问题描述】:
我正在尝试创建一个数据框,使用PySpark, by:
lr_col = predictions_lr.select('prediction_1')
nb_col = predictions_nb.select('prediction_2')
df = spark.createDataFrame([lr_col, nb_col])
但是,当我运行上面的代码时,我得到了这个错误:
AssertionError:位于 0x00000237C7D2B550 的 dataType py4j.java_gateway.JavaMember 对象应该是类 'pyspark.sql.types.DataType' 的实例
如何将我的数据转换为请求的数据类型?
【问题讨论】:
-
lr_col和nb_col是什么? -
单列数据集。
-
我的意思是,它们是什么类型的对象?
-
它们是浮动的。
-
我不是指它们包含的对象类型。
print(type(lr_col))带给你什么?