视频地面实况的最佳实践？

【问题标题】：Best practise for video ground truthing?视频地面实况的最佳实践？
【发布时间】：2019-11-18 08:42:39
【问题描述】：

我想训练一个深度学习框架 (TensorFlow) 以使用新的对象类别进行对象检测。

作为地面实况的来源，我有多个包含对象的视频文件（只有部分图像包含对象）。

我应该如何验证视频的真实性？即使这些视频帧非常相似，我是否应该逐帧提取并标记每一帧？或者这样的任务的最佳实践是什么？

首选开源工具。

【问题讨论】：

【解决方案1】：

它通常如您所描述的那样工作。至少对于零次迭代：

这是一个训练集示例，由上述方法生成 (see it in action)

对于迭代一，您可以使用迭代零模型并显着改进第 2 步和第 3 步以进一步增加训练集。

我正在尝试解决几乎相同的问题，因为很难生成训练集来获得准确的分割：

基本上，从半手动方法开始，然后尝试发展。

【讨论】：