【发布时间】:2021-06-04 05:16:43
【问题描述】:
我正在尝试使用 GPU 用我自己的数据训练模型。有 8 类对象需要检测,但是当我开始训练时出现分配错误。
我尝试使用不同的预训练模型,但它继续给我同样的错误。我也尝试减少 .config 文件中的“batch-size”,但它仅在我将 batch-size 等于 1 时才有效。
我已通过此链接使用自定义数据训练模型:https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html#training-the-model
是我的硬件不够用还是别的什么?
GPU:英伟达 GTX 1650
CPU:英特尔 i7 9750H
内存:16 GB
【问题讨论】:
-
GPU 非常擅长 tensorflow,因为它的构建方式。我无法具体告诉您您需要多少功率,但我制作的模型要少得多(尽管没有使用 tensorflow)。如果您遇到问题,请尝试关闭您的 GPU,因为它看起来比 tensorflow 更强大。
-
是的,这足以训练模型。如果您刚刚开始,fast.ai 可能是一个非常好的起点。您可以在几分钟内训练出世界一流的模型。
-
您可以尝试使用梯度累积的概念,这是一个巧妙的技巧,可以在没有太多 GPU 内存的情况下虚拟使用更大的批量大小。您可以在this 帖子中了解更多信息
标签: python tensorflow computer-vision object-detection