【发布时间】:2019-11-29 07:56:34
【问题描述】:
我正在使用来自 Berkeley Deep Drive 数据集的 900 张图像重新训练 SSD MobileNet,并对来自该数据集的 100 张图像进行评估。
问题是经过大约 24 小时的训练,totalloss 似乎无法低于 2.0:
而且对应的mAP分数相当不稳定:
事实上,我实际上已经尝试训练了大约 48 小时,TotoalLoss 就是不能低于 2.0,介于 2.5~3.0 之间。而那段时间,mAP 甚至更低..
所以这是我的问题,鉴于我的情况(我真的不需要任何“高精度”模型,如您所见,我选择了 900 张图像进行训练,并且想简单地做一个 PoC 模型训练/预测就是这样),我应该什么时候停止训练并获得一个合理执行的模型?
【问题讨论】:
-
你使用了哪个优化器和学习率?您是否使用了某种学习率调度程序?
-
@Koanashi 我基本上下载了一个用TensorFlow预训练的SSD mobilenet模型,并重复使用它的配置文件。
-
我认为您应该搜索网络或源代码库以了解如何微调检测管道。因为我认为在你的情况下,你会失去预训练模型的好处,因为你从一个太高的学习率开始,让所有的权重都可以训练。
标签: tensorflow deep-learning computer-vision object-detection training-data