【发布时间】:2018-10-23 00:24:01
【问题描述】:
我正在寻找 pandas 数据框的 pyspark 等效项。 特别想对pyspark dataframe做如下操作
# in pandas dataframe, I can do the following operation
# assuming df = pandas dataframe
index = df['column_A'] > 0.0
amount = sum(df.loc[index, 'column_B'] * df.loc[index, 'column_C'])
/ sum(df.loc[index, 'column_C'])
我想知道对 pyspark 数据框执行此操作的 pyspark 等效项是什么?
【问题讨论】:
标签: python pandas apache-spark dataframe pyspark