【发布时间】:2018-09-07 10:52:21
【问题描述】:
Pyspark 中这个操作的等价物是什么?
import pandas as pd
import numpy as np
df = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')})
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
print(df)
输出
Set Type color
0 Z A green
1 Z B green
2 X B red
3 Y C red
【问题讨论】: