【发布时间】:2021-12-10 02:16:09
【问题描述】:
我正在尝试使用 Faster-RCNN 架构(准确地说是Faster R-CNN ResNet50 V1 640x640,来自here)加载检查点并填充模型权重。我正在尝试为该网络加载权重,类似于它在example notebook for RetinaNet,他们在其中执行以下操作:
fake_box_predictor = tf.compat.v2.train.Checkpoint(
_base_tower_layers_for_heads=detection_model._box_predictor._base_tower_layers_for_heads,
_box_prediction_head=detection_model._box_predictor._box_prediction_head,
)
fake_model = tf.compat.v2.train.Checkpoint(
_feature_extractor=detection_model._feature_extractor,
_box_predictor=fake_box_predictor
)
ckpt = tf.compat.v2.train.Checkpoint(model=fake_model)
ckpt.restore(checkpoint_path).expect_partial()
我正在尝试为我想要使用的 Faster-RCNN 网络提供类似的检查点加载机制,但 _base_tower_layers_for_heads、_box_prediction_head 等属性仅适用于示例中使用的架构,而不适用于还有什么。
对于我的特定用例,我也找不到关于使用 Checkpoint 填充模型的哪些部分的文档。非常感谢任何有关如何解决此问题的帮助!
【问题讨论】:
标签: python tensorflow transfer-learning tensorflow-model-garden