【发布时间】:2016-02-19 00:32:37
【问题描述】:
我想对单个列执行操作。 不幸的是,在我转换该列之后,它现在不再是它来自的数据框的一部分,而是一个 Column 对象。因此,它无法收集。
这是一个例子:
df = sqlContext.createDataFrame([Row(array=[1,2,3])])
df['array'].collect()
这会产生以下错误:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'Column' object is not callable
如何在单个列上使用collect() 函数?
【问题讨论】:
标签: apache-spark dataframe pyspark apache-spark-sql