【问题标题】:Where is data cached when using a Cloud TPU?使用 Cloud TPU 时数据缓存在哪里?
【发布时间】:2020-10-19 09:17:17
【问题描述】:

我有一个关于使用 TPU 的问题。当我将 .cache() 与数据集一起使用时,数据缓存在哪里?它是缓存在租用的 VM 实例的 RAM(例如 n1-standard-2)还是 TPU 的内存中。换句话说,如果我有一个~30G的数据集,我是需要租一个RAM>30G的VM实例来有效缓存数据,还是数据缓存在TPU内存中,我不需要担心VM实例大小。

同样的问题是,数据增强是在哪里进行的,在 VM 实例的 CPU 中还是在 TPU 中的 CPU 中?

谢谢!

【问题讨论】:

    标签: google-cloud-tpu


    【解决方案1】:

    当您调用 .cache() 时,它会尝试在 TPU VM 上缓存数据集,而不是在 GCE VM(例如 n1-standard-2)上,因为 TPU VM 具有比这更多的可用内存。但是,一般来说,在 TPU 上运行时您不想调用它,因为我们使用 GCSFileSystem 在 TFRecord 分片的后台进行缓存:https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/platform/cloud/gcs_file_system.cc

    【讨论】:

      猜你喜欢
      • 2011-01-28
      • 2022-11-10
      • 2015-04-28
      • 1970-01-01
      • 2020-04-15
      • 2017-04-24
      • 1970-01-01
      • 2018-07-05
      • 1970-01-01
      相关资源
      最近更新 更多