【发布时间】:2021-01-17 17:28:15
【问题描述】:
如何将tf.keras.layers 与tf.Variable 相乘?
上下文:我正在创建一个依赖于样本的卷积过滤器,它由一个通用过滤器W 组成,该过滤器通过依赖于样本的移位+缩放进行转换。因此,卷积原始滤波器W 转换为aW + b,其中a 是与样本相关的缩放,b 是与样本相关的移位。一个应用是训练一个自动编码器,其中样本依赖项是标签,因此每个标签都会移动/缩放卷积滤波器。由于与样本/标签相关的卷积,我使用tf.nn.conv2d 将实际过滤器作为输入(而不仅仅是过滤器的数量/大小)和一个带有tf.map_fn 的lambda 层以应用不同的“变换过滤器”(基于标签)为每个样本。虽然细节有所不同,但这种依赖于样本的卷积方法在这篇博文中进行了讨论:Tensorflow: Convolutions with different filter for each sample in the mini-batch。
这是我的想法:
input_img = keras.Input(shape=(28, 28, 1))
label = keras.Input(shape=(10,)) # number of classes
num_filters = 32
shift = layers.Dense(num_filters, activation=None, name='shift')(label) # (32,)
scale = layers.Dense(num_filters, activation=None, name='scale')(label) # (32,)
# filter is of shape (filter_h, filter_w, input channels, output filters)
filter = tf.Variable(tf.ones((3,3,input_img.shape[-1],num_filters)))
# TODO: need to shift and scale -> shift*(filter) + scale along each output filter dimension (32 filter dimensions)
我不确定如何实现TODO 部分。我在想tf.keras.layers.Multiply() 用于缩放和tf.keras.layers.Add() 用于移动,但据我所知,它们似乎不适用于 tf.Variable。我该如何解决这个问题?假设尺寸/形状广播工作,我想做这样的事情(注意:输出应该仍然与 var 相同的形状,只是沿着 32 个输出过滤器维度中的每一个进行缩放)
output = tf.keras.layers.Multiply()([var, scale])
【问题讨论】:
-
你能解释一下你的
var的形状吗? -
对不起,不够清晰。我将
var更改为filter以表明这是卷积滤波器(在移位/缩放之前)。它的形状为 (filter_height, filter_width, input channels, output filters),在本例中为 (3,3,1,32)。
标签: tensorflow keras conv-neural-network keras-layer map-function