【发布时间】:2020-06-30 16:19:13
【问题描述】:
当我在 Apache Spark 上运行作业时,Web UI 会提供类似于以下的视图:
虽然这对我作为开发人员查看事物在哪里非常有用,但我认为阶段描述中的行号对我的支持团队来说并没有那么有用。为了让他们的工作更轻松,我希望能够为我工作的每个阶段以及工作本身提供一个定制名称,如下所示:
这可以在 Spark 中完成吗?如果是这样,我该怎么做?
【问题讨论】:
-
不幸的是,这对给定工作的每个阶段都给出了相同的描述。我希望能够给不同的阶段起不同的名称。
-
也许我误解了一些东西,但是设置阶段描述的能力对 Web UI 的用户来说不是很重要吗?依赖操作名称的默认值 - “map”、“forEachPartition”等如果没有对代码库有很好的了解,几乎没有用处。也许我做错了 Spark?
-
我认为作业、阶段、任务的概念是相当低级的,Spark 开发人员在他们熟悉代码库之后就会知道它们(他们通常是自己开发的)。因此,他们知道
map、foreachPartition等在代码中的位置,但不一定知道它们如何转化为工作、阶段和任务。
标签: apache-spark