【问题标题】:Convert PySpark DataFrame back to rows将 PySpark DataFrame 转换回行
【发布时间】:2016-05-25 11:34:06
【问题描述】:

我有一些现有的代码依赖于连续的数据: [u'0,1,1,5,0,1382,4,15]

为了进行一些转换,我必须将我的 RDD 转换为数据帧 sp,它现在看起来像这样:

行(a=u'1', code=u'ts=12206384',date=u'2014-10-05', cstat='200', 'substat'=0,', time=0,时间=u'00:06:18' 目标=0)]

是否可以将 spark DF 转换回其原始行格式,以便我的其余代码可以工作?

【问题讨论】:

    标签: dataframe pyspark transformation rdd


    【解决方案1】:

    我假设你的意思是你想从 Row 对象返回一个逗号分隔值的字符串。

    您将获取包含 Row 对象的数据框并执行以下操作:

    df_of_row_objects.map(lambda row: ",".join(x for x in row))

    此代码遍历数据框中的每个 Row,并用逗号连接行中的每个项目。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-09-24
      • 1970-01-01
      • 2022-06-11
      • 2022-12-18
      • 2016-05-29
      • 1970-01-01
      • 2021-06-29
      • 2023-03-13
      相关资源
      最近更新 更多