【发布时间】:2020-07-23 16:38:54
【问题描述】:
我想在开始处理之前扩展 spark 集群以使所有工作节点都启动并运行。问题是因为工作节点的自动缩放不会在加载时立即发生,并且会导致工作节点崩溃。集群有 32 个节点,但只有 4 个节点超载并崩溃,所以我要做的是在 python 笔记本的开头编写一些代码行,这将启动剩余节点并启动并运行 24 个节点,然后执行实际数据处理。这可以使用代码吗?请指教。
【问题讨论】:
-
如果我的答案对您有帮助,您可以接受它作为答案(点击答案旁边的复选标记,将其从灰色切换为已填充。)。这对其他社区成员可能是有益的。谢谢。
标签: apache-spark databricks azure-databricks