【发布时间】:2018-04-25 07:29:17
【问题描述】:
我已经尝试这个问题好几个星期了,但没有成功。
我的问题是:
深度学习模型有以下信息:
输入:图像序列
输出:图像中发生了什么,即从 10 个活动的序列中对正在发生的活动进行分类。
我有两个摄像头从两个视图记录相同的活动,我如何结合这两个视图来提高准确性?
【问题讨论】:
标签: deep-learning keras keras-layer
我已经尝试这个问题好几个星期了,但没有成功。
我的问题是:
深度学习模型有以下信息:
输入:图像序列
输出:图像中发生了什么,即从 10 个活动的序列中对正在发生的活动进行分类。
我有两个摄像头从两个视图记录相同的活动,我如何结合这两个视图来提高准确性?
【问题讨论】:
标签: deep-learning keras keras-layer
我认为你应该使用 DELF 特征,提取两个相似图像的特征并将它们组合起来。
【讨论】:
如何结合这两种观点完全取决于你对问题的理解。让我给你两个不同的例子,
案例一:当您查看您的训练数据时,您可以轻松判断哪个相机更适合某些数据。例如一台相机可能会捕捉到所有有用的东西,而另一台相机可能由于可能的遮挡而无法捕捉(注意:我并不是说一台相机总是比另一台更好)。在这种情况下,您可以使用稍后的融合技术来仅融合代表来自两个相机的序列的两个结果特征。
案例二:你很难判断哪个相机更好。这基本上表明,在考虑两个摄像头后,您可能看不到性能提升,但可能会有一些小的改进。
最后,当您说两个摄像头时,您是否可以做双目立体视觉之类的事情?在这种情况下,您可能会获得额外的深度信息,这些信息不包含在任何单个相机中,并且可能有助于识别任务。
【讨论】: