【发布时间】:2017-12-18 23:59:34
【问题描述】:
我想提取一维 CNN 层的权重,并了解如何准确计算预测值。我无法使用get_weights() 函数的权重重新生成预测值。
为了说明我的理解,这里有一个小数据集。
n_filter = 64
kernel_size = 10
len_timeseries = 123
n_feature = 3
X = np.random.random(sample_size*len_timeseries*n_feature).reshape(sample_size,len_timeseries,n_feature)
y = np.random.random(sample_size*(len_timeseries-kernel_size+1)*n_filter).reshape(sample_size,
(len_timeseries-kernel_size+1),
n_filter)
现在,创建一个简单的 1d CNN 模型:
model = Sequential()
model.add(Conv1D(n_filter,kernel_size,
input_shape=(len_timeseries,n_feature)))
model.compile(loss="mse",optimizer="adam")
拟合模型并将X的值预测为:
model.fit(X,y,nb_epoch=1)
y_pred = model.predict(X)
y_pred 的维度应该是(1000, 114, 64)。
现在,我想使用存储在model.layer 中的权重重现y_pred[irow,0,ilayer]] 的值。因为只有单层,len(model.layer)=1。所以我从第一层和唯一的层中提取权重:
weight = model.layers[0].get_weights()
print(len(weight))
> 2
weight0 = np.array(weight[0])
print(weight0.shape)
> (10, 1, 3, 64)
weight1 = np.array(weight[1])
print(weight1.shape)
> (64,)
权重的长度为 2,我假设第 0 个位置包含特征的权重,第 1 个位置包含偏差。
作为weight0.shape=(kernel_size,1,n_feature,n_filter),我认为我可以通过以下方式获取y_pred[irow,0,ilayer]的值:
ifilter = 0
irow = 0
y_pred_by_hand = weight1[ifilter] + np.sum( weight0[:,0,:,ifilter] * X[irow,:kernel_size,:])
y_pred_by_hand
> 0.5124888777
但是,这个值与y_pred[irow,0,ifilter] 完全不同:
y_pred[irow,0,ifilter]
>0.408206
请告诉我哪里出错了。
【问题讨论】:
标签: python keras keras-layer deeplearning4j