paper: Video Propagation Networks
link:http://cn.arxiv.org/pdf/1612.05478v2.pdf
摘要: 在本文中,我们提出了一种传播信息的技术 通过视频数据转发。这个方法是概念上的简单,可以应用于需要传播结构化信息,如语义标签, 基于视频内容。我们提议进行视频传播 以自适应方式处理视频帧的网络 态度。模型是在线应用的:它传播信息 无需访问未来帧即可前进 而不是现在的。特别是我们结合了两个 组件,用于密集和 视频自适应过滤,然后是一个空间网络 改进功能并提高灵活性。我们做实验 论视频对象分割与语义视频分割 表现出比以前最好的任务特定方法,同时有利于运行时。此外,我们还演示了我们的方法 关于在一个实例中传播颜色的回归任务灰度视频。
2 相关工作
结论:
我们提出了一种快速、可扩展和通用的神经网络。 基于学习的信息传播方法 频帧。视频传播网络采用双向远程视频信息自适应传播网络 从上一帧到当前帧然后通过标准的空间网络进行优化。实验 不同的任务表明,尽管v*n是通用的,但其性能仍然优于其他类型的v*n。 当前最先进的任务特定方法。 我们技术的核心是开发和 修改可学习的双边过滤以用于视频处理。我们使用了简单而固定的网络架构 对于所有展示通用性的任务 方法。取决于问题类型和数据的可用性,使用更多的过滤器和更深的层会产生更好的性能。在这项工作中,我们手动调整了可以适应的特征尺度 学习。找到最佳但快速计算双边特征的方法对于视频和学习他们的尺度是一个重要的未来研究方向。
先做个粘贴