【发布时间】:2021-04-19 09:25:36
【问题描述】:
我想对 Databricks 进行一些性能测试。为此,我想记录我在测试期间使用的集群(VM 类型,例如 Standard_DS3_v2)(我们可以假设驱动程序和工作程序节点是相同的)。我知道我可以记录工人数量、核心数量(至少在驱动程序上)和内存(至少在驱动程序上)。但是,我想知道 VM 类型,因为我希望能够识别我是否使用了例如存储优化或通用集群。代替 VM 类型,此信息也可以。最理想的情况是,我可以在笔记本中的变量中将这些信息作为字符串获取,以便稍后将其与我正在记录的其他信息一起从那里写入我的日志文件。但是,如果没有直接的解决方案,我也对任何 hacky 解决方法感到满意。
【问题讨论】:
标签: python scala apache-spark databricks