【发布时间】:2023-03-23 15:33:02
【问题描述】:
是否可以跟踪 VertexAI 管道运行消耗的资源,类似于 Dataflow 的做法,它显示当前正在运行以执行管道的节点数的实时图表?
【问题讨论】:
标签: google-cloud-platform google-cloud-ai google-cloud-vertex-ai
是否可以跟踪 VertexAI 管道运行消耗的资源,类似于 Dataflow 的做法,它显示当前正在运行以执行管道的节点数的实时图表?
【问题讨论】:
标签: google-cloud-platform google-cloud-ai google-cloud-vertex-ai
Vertex AI Pipeline 为Visualizing and analyzing 管道结果提供了一项功能。
此功能可用于在 Pipeline 部署后检查资源利用率。
步骤:
Go to vertex AI pipeline->
Select a pipeline->
pipeline step->
view job(from Pipeline run analysis pane)
在“查看作业”窗格中,我们可以检查使用的资源,即机器类型、机器计数、管道步骤的 CPU 利用率图,我们也可以查看日志。
用途:
根据document,来自 Vertex AI 的指标(如 CPU 利用率、CPU 负载)处于Beta 启动阶段。但是,您可以通过参考此document 来检查 Cloud Monitoring 中的 CPU 利用率等指标,也可以找到以下快照以获取更多参考。
要更改图表的时间线,您必须在 metrics explorer 中选择 custom 选项并提供您想要查看的持续时间的日期和时间,如图所示在下面的屏幕截图中。
【讨论】: