【发布时间】:2021-01-14 09:36:22
【问题描述】:
跟进this 问题和数据框,我正在尝试转换它
进入这个(我知道它看起来一样,但请参阅下一行代码以查看差异):
在 pandas 中,我使用了行代码teste_2 = (value/value.groupby(level=0).sum()),在 pyspark 中我尝试了几种解决方案;第一个是:
df_2 = (df/df.groupby(["age"]).sum())
但是,我收到以下错误:TypeError: unsupported operand type(s) for /: 'DataFrame' and 'DataFrame'
第二个是:
df_2 = (df.filter(col('Siblings'))/gr.groupby(col('Age')).sum())
但它仍然无法正常工作。谁能帮帮我?
【问题讨论】:
-
你想在这里做什么?你能显示示例数据框和所需的输出吗?
-
是的,抱歉,将编辑@mck
-
@mck 已编辑!我觉得现在更容易理解了
标签: dataframe apache-spark pyspark apache-spark-sql divide