【发布时间】:2016-08-11 22:02:40
【问题描述】:
df:
[Row(split(value,,)=[u'21.0', u'1',u'2']),Row(split(value,,)=[u'22.0', u'3',u'4'])]
如何将df中的每一行转换为LabeledPoint对象,该对象由一个标签和特征组成,其中第一个值是标签,其余2个是每一行中的特征。
mycode:
df.map(lambda row:LabeledPoint(row[0],row[1: ]))
它似乎不起作用,新的火花因此任何建议都会有所帮助。
【问题讨论】:
-
@LostInOverflow 不,不是,这是来自数据帧,来自 RDD。
-
@LostInOverflow 你能给我一些建议吗?
标签: python apache-spark pyspark apache-spark-mllib pyspark-sql