【发布时间】:2020-03-23 16:39:22
【问题描述】:
我是深度学习的新手,我正在从事一个与足球运动分析相关的爱好项目。我想使用足球视频并将它们转换为 2D 地图。我把这个过程分解成更小的步骤。第一步是能够检测球员和足球。
我正在考虑从预先训练的对象检测模型开始。我已经拍摄了一段视频并从中生成了图像。我在其中一张图像上使用了它,并附上了输出。它显然没有处理很多事情。解决这个问题的一种方法是进行一些迁移学习。为此,我将不得不生成自己的数据集。我能想到的唯一方法是将此图像切成窗口并手动将它们标记为球员和足球。
这似乎是一项乏味的任务。还有其他有效的数据生成方式吗?有哪些最佳做法?
【问题讨论】:
-
数据标记很乏味,期间。您可以在 Amazon Turk 上上传您的图片供人们标记价格,或者您可以使用您现有的模型(如果足够好)生成您只需要更正的框。
-
我只是使用没有修改的对象检测模型。显然,很多玩家都没有接受。不幸的是,它也没有生成错误分类的框来纠正。是的!数据标注很繁琐!将检查亚马逊土耳其人。谢谢。
-
一种常见的技术是运行模型,保持良好的检测,用这些检测重新运行模型,冲洗并重复。你应该得到越来越多的标签。它不会取代您的工作,因为您仍然需要管理输出,但它可以避免您需要手工制作每个标签。哦,显然数据扩充是小型数据集的关键。
标签: tensorflow deep-learning object-detection