【发布时间】:2021-05-11 10:03:04
【问题描述】:
我想使用深度学习和计算机视觉技术检测和计算葡萄园中的葡萄藤数量。我正在使用 YOLOv4 对象检测器并在 darknet 框架上进行训练。我已经能够将 SORT 跟踪器集成到我的应用程序中并且运行良好,但我仍然遇到以下问题:
- 跟踪器有时会为对象重新分配一个新 ID
- 检测器有时会错误识别对象(导致不正确的跟踪)
- 跟踪器有时不会跟踪检测到的对象。
您可以在以下image 中查看重新分配问题的示例。如您所见,在第 40 帧中,id 9 是一根金属柱,从第 42 帧开始,它被分配给一棵树
在寻找这些问题的原因时,我了解到DeepSORT 是 SORT 的改进版本,旨在通过使用神经网络将轨迹与检测相关联来处理此问题。
问题:
我面临的问题是为 Deepsort 训练这个特定模型。我看到作者使用cosine metric learning 来训练他们的模型,但我无法为我的自定义类自定义学习。我的问题如下:
-
我有一个带注释的 (YOLO TXT 格式) 图像数据集,我用它来训练 YOLOv4 模型。我可以为 Deepsort 跟踪器重复使用相同的数据集吗?如果是,那怎么办?
-
如果我不能重用数据集,那么如何创建自己的数据集来训练模型?
提前感谢您的帮助!
【问题讨论】:
-
嗨,我现在也有同样的问题。您找到任何有用的解决方案了吗?
-
嗨@M.Akyuzlu,我发现khaylang 的答案对于理解如何传递数据非常有用,而且我还遵循了这个特定的教程:github.com/abhyantrika/nanonets_object_tracking。
-
谢谢@Sampreet Sarkar,我刚刚意识到我们不需要 YOLO TXT FORMAT 来进行余弦度量学习。我们只是实现图像我对吗?
-
嘿@M.Akyuzlu,如果您查看他们使用的数据集(一些汽车数据集),您会发现他们只是将图像裁剪为仅包含图像中的汽车。因此,也许您可以使用带注释的基本事实来创建类似的裁剪数据集。
标签: python tensorflow computer-vision object-detection