【发布时间】:2021-09-14 22:06:42
【问题描述】:
我一直在使用 Prefect 进行工作流管理,但被卡住了 与 Prefect 的资源管理器建立和终止 Spark 会话。
我浏览了 Prefects 文档,并提供了 Dusk 的示例:
from prefect import resource_manager
from dask.distributed import Client
@resource_manager
class DaskCluster:
def init(self, n_workers):
self.n_workers = n_workers
def setup(self):
"Create a local dask cluster"
return Client(n_workers=self.n_workers)
def cleanup(self, client):
"Cleanup the local dask cluster"
client.close()
with Flow("example") as flow:
n_workers = Parameter("n_workers")
with DaskCluster(n_workers=n_workers) as client:
some_task(client)
some_other_task(client)
但是我不知道如何使用 spark 会话来做同样的事情。
【问题讨论】:
标签: apache-spark pyspark prefect