【发布时间】:2020-04-25 07:10:47
【问题描述】:
如何在 GCP 上具有多个 CPU 和 GPU 的机器上训练具有 tensorflow 2 后端的 keras 模型? tf 是否在后端处理进程本身?如果是这样,我该如何验证?任何简单的示例代码表示赞赏。
【问题讨论】:
标签: multithreading keras google-cloud-platform deep-learning tensorflow2.0
如何在 GCP 上具有多个 CPU 和 GPU 的机器上训练具有 tensorflow 2 后端的 keras 模型? tf 是否在后端处理进程本身?如果是这样,我该如何验证?任何简单的示例代码表示赞赏。
【问题讨论】:
标签: multithreading keras google-cloud-platform deep-learning tensorflow2.0
您可以通过多种方式使用 GCP 来训练模型。
以下是其中一些(具有不同级别的 Google 管理):
1 - 您可以创建一个Compute Engine Instance(您可以选择所需的处理量和 CPU/GPU 的类型)并在那里进行培训。一切都通过 SSH 管理,没有安装图形界面或 python 依赖项。
2 - 你可以创建一个AI Platform Notebook,它已经被创建并安装了所需的 tensorflow 版本和 Jupyterlab。您可以通过 Jupyterlab 界面或 SSH 访问它。您还可以在此处选择处理选项。
3 - 您可以让AI Platform train 为您进行在线培训。 Here 你有关于在线训练期间 CPU / GPU 使用情况的文档。
常用的管道是 [在 AI Notebooks 上开发 > 使用 AI Local Train 和数据子集进行本地训练 > 使用 AI Platform Train 和完整数据集在线训练以部署模型]
【讨论】: