【发布时间】:2018-04-12 01:04:30
【问题描述】:
我有一个表单列表
[Row(_1=u'5', _2=u'6')]
我想把它转换成
[(5,6)]
使用 PySpark
【问题讨论】:
-
这是 RDD 还是列表?我怀疑它只是一个列表,所以这里不需要 Pyspark,而只是普通的 Python。类似
[x[0] for x in <your_list>]
标签: python apache-spark pyspark