【问题标题】:Training convolutional nets on multi-channel image data sets在多通道图像数据集上训练卷积网络
【发布时间】:2017-08-22 14:43:14
【问题描述】:

我正在尝试从头开始实现卷积神经网络,但我无法弄清楚如何对具有 3 维的 rgb 等多通道图像执行(矢量化)操作。在遵循 this CS231n tutorial 等文章和教程后,很明显为单个输入实现网络,因为输入层将是一个 3d 矩阵,但数据集中总是有多个数据点。所以,我不知道如何实现这些网络以对整个数据集进行矢量化操作。

我已经实现了一个将 3d 矩阵作为输入的网络,但现在我意识到它不适用于整个数据集,但我必须一次传播一个输入。我真的不知道 conv 网络是否是是否对整个数据集进行矢量化。但如果是,我如何对多通道图像的卷积网络进行矢量化?

【问题讨论】:

  • 您是否为此使用了一些库?一般来说,CNN 很容易处理频道。
  • @JonasAdler 我正在使用 c++ 的犰狳库来处理线性代数。具体来说,我分别对 2D 和 3D 矩阵使用矩阵和立方体数据结构。

标签: machine-learning neural-network computer-vision conv-neural-network convolution


【解决方案1】:

如果我的问题是正确的,那么您基本上是在问如何为小批量做卷积层,这将是一个 4-D 张量。

简单地说,您希望独立处理批次中的每个输入,并对每个输入应用卷积。在不使用循环向量化的情况下进行编码是相当简单的。

矢量化实现通常基于im2col technique,它基本上将 4-D 输入张量转换为巨型矩阵并执行矩阵乘法。这是在 python 中使用numpy.lib.stride_tricks 的前向传递实现:

import numpy as np

def conv_forward(x, w, b, stride, pad):
  N, C, H, W = x.shape
  F, _, HH, WW = w.shape

  # Check dimensions
  assert (W + 2 * pad - WW) % stride == 0, 'width does not work'
  assert (H + 2 * pad - HH) % stride == 0, 'height does not work'

  # Pad the input
  p = pad
  x_padded = np.pad(x, ((0, 0), (0, 0), (p, p), (p, p)), mode='constant')

  # Figure out output dimensions
  H += 2 * pad
  W += 2 * pad
  out_h = (H - HH) / stride + 1
  out_w = (W - WW) / stride + 1

  # Perform an im2col operation by picking clever strides
  shape = (C, HH, WW, N, out_h, out_w)
  strides = (H * W, W, 1, C * H * W, stride * W, stride)
  strides = x.itemsize * np.array(strides)
  x_stride = np.lib.stride_tricks.as_strided(x_padded,
                                             shape=shape, strides=strides)
  x_cols = np.ascontiguousarray(x_stride)
  x_cols.shape = (C * HH * WW, N * out_h * out_w)

  # Now all our convolutions are a big matrix multiply
  res = w.reshape(F, -1).dot(x_cols) + b.reshape(-1, 1)

  # Reshape the output
  res.shape = (F, N, out_h, out_w)
  out = res.transpose(1, 0, 2, 3)
  out = np.ascontiguousarray(out)
  return out

请注意,它使用了线性代数库的一些重要功能,这些功能在 numpy 中实现,但可能不在您的库中。

顺便说一句,您通常不希望将整个数据集作为一个批次推送 - 将其拆分为多个批次。

【讨论】:

  • 有什么方法可以矢量化后向传递(反卷积)?
猜你喜欢
  • 1970-01-01
  • 2016-12-27
  • 2016-08-17
  • 2018-05-01
  • 2017-12-27
  • 2019-04-11
  • 1970-01-01
  • 1970-01-01
  • 2020-10-03
相关资源
最近更新 更多