【发布时间】:2020-05-16 21:03:16
【问题描述】:
我想将聚合数据放入内存但出现错误。有什么建议吗??
orders = spark.read.json("/user/order_items_json")
df_2 = orders.where("order_item_order_id == 2").groupby("order_item_order_id")
df_2.persist(StorageLevel.MEMORY_ONLY)**
Traceback(最近一次调用最后一次): 文件“”,第 1 行,在 AttributeError: 'GroupedData' 对象没有属性 'persist'
【问题讨论】:
标签: apache-spark pyspark