【发布时间】:2017-07-22 14:30:36
【问题描述】:
声明:我对 CNN 和深度学习一无所知,也不知道Torch。
我将SIFT 用于我的对象识别应用程序。我发现这篇论文Discriminative Learning of Deep Convolutional Feature Point Descriptors 特别有趣,因为它是基于 CNN 的,比经典的图像描述方法(例如 SIFT、SURF 等)更精确,但是(引用摘要):
在我们开发的训练和测试期间使用 L2 距离 128-D 描述符,其欧几里德距离反映补丁相似性, 并且可以用作任何涉及的任务的直接替代品 筛选
哇,太棒了:这意味着我们可以继续使用任何基于 SIFT 的方法,但要使用更精确的描述符!
但是,引用github code repository README:
请注意,输出将是一个 Nx128 2D 浮点张量,其中每一行是一个 描述符。
那么,什么是“2D 浮点张量”? SIFT 描述符矩阵是 Nx128 浮点数,有什么我遗漏的吗?
【问题讨论】:
-
哦,好吧,这让我很尴尬。谢谢@FranckDernoncourt
-
太多不同的术语在研究中具有相同的含义……
标签: tensorflow computer-vision deep-learning torch tensor