【发布时间】:2017-07-28 02:01:24
【问题描述】:
我正在从作为 Keras 应用程序包含的 VGG16 模型中提取较低级别的功能。这些特征作为附加分类器的预训练输入数据的单独输出导出。概念思路借鉴自Multi-scale recognition with DAG-CNNs
使用没有分类器顶部的模型,使用Flatten():block_05 = Flatten(name='block_05')(block5_pool)从block_5拉层提取最高级别的特征。这给出了一个维度为 8192.Flatten() 的输出向量,但是由于维度变得太大(内存问题),因此不适用于较低的拉动层。相反,可以使用GlobalAveragePooling2D():block_04 = GlobalAveragePooling2D(name='block_04')(block4_pool) 提取较低的拉动层(或任何其他层)。然而,这种方法的问题在于,特征向量的维度越低越快:block_4 (512)、block_3 (256)、block_2 (128)、block_1 (64)。
什么是合适的层或设置来保留来自更深层的更多特征数据?
对于信息,模型的输出如下所示,附加分类器具有相应数量的输入。
# Create model, output data in reverse order from top to bottom
model = Model(input=img_input, output=[block_05, # ch_00, layer 17, dim 8192
block_04, # ch_01, layer 13, dim 512
block_03, # ch_02, layer 9, dim 256
block_02, # ch_03, layer 5, dim 128
block_01]) # ch_04, layer 2, dim 64
【问题讨论】:
-
这个有趣的方法。您能否更详细地解释一下您想如何使用这些较低层的功能?
-
更新了关于发布的帖子。输出的合并是在单独的分类器(作为输入)中完成的,因为这样可以对预处理的输入进行优化,以查看哪些特征层对模型的添加最多。
标签: machine-learning neural-network deep-learning keras keras-layer