【发布时间】:2018-05-28 11:51:30
【问题描述】:
我有一个带有一列数字的 pyspark 数据框。我需要对该列求和,然后将结果返回为 python 变量中的 int。
df = spark.createDataFrame([("A", 20), ("B", 30), ("D", 80)],["Letter", "Number"])
我执行以下操作来对列求和。
df.groupBy().sum()
但我得到了一个数据框。
+-----------+
|sum(Number)|
+-----------+
| 130|
+-----------+
我会将 130 作为 int 返回,存储在一个变量中,以便在程序的其他地方使用。
result = 130
【问题讨论】:
标签: python dataframe sum pyspark