【发布时间】:2017-04-13 23:00:19
【问题描述】:
谁能解释一下如何使用Conv3D 或ConvND 表示Depth-images 或Caffe 中的视频或几乎任何3d(n-d?)数据?
Conv3D 是否有任何示例或演示?
【问题讨论】:
标签: computer-vision neural-network deep-learning video-processing caffe
谁能解释一下如何使用Conv3D 或ConvND 表示Depth-images 或Caffe 中的视频或几乎任何3d(n-d?)数据?
Conv3D 是否有任何示例或演示?
【问题讨论】:
标签: computer-vision neural-network deep-learning video-processing caffe
您可以使用常规的"Convolution" 层来处理任何维度的 blob。您只需要密切关注参数:
layer {
type: "Convolution"
name: "conv_nd"
bottom: "in" # 5D blob
too: "out"
convolution_param {
kernel_size: 3
kernel_size: 5
kernel_size: 5 # define 3 by 5 by 5 kernel
pad: 1
pad: 2
pad: 2 # pad according to kernel size
stride: 1
stride: 2
stride: 2 # you can have different stride for different dimensions
axis: 1 # the "channel" dimension
num_output: 30 # output 30 dim per 3D voxel
}
}
有关更多信息,请阅读 caffe.proto file 中有关卷积参数的 cmets。
【讨论】:
3 by 5 by 5 = depth by height by width 对吗? @Shai
num_output: 10 则输出为10-by-5-by-200-by-200(假设您根据kernel_size 填充)。