【问题标题】:What are the outputs of the Object Detection API of Tensorflow?Tensorflow 的对象检测 API 的输出是什么?
【发布时间】:2018-09-28 11:33:37
【问题描述】:

我使用了位于 https://github.com/tensorflow/models/tree/master/research/object_detection 中的 Tensorflow 的对象检测 API。我使用summarize_graph 并验证输出是detection_boxesdetection_scoresdetection_classesnum_detections

这些是什么?其中哪个包含被检测物体的检测框坐标?

我显示了每个输出的形状并找到了它们的大小:

  • detection_boxes.shape = (1,300,4)
  • detection_scores.shape = (1, 300)
  • detection_classes.shape = (1, 300)
  • num_detections.shape = (1,)

在一张包含 8 张扑克牌的图像上进行测试时。考虑的类别是数字 A、2、3、4、5 和 6。

【问题讨论】:

    标签: python tensorflow image-processing video-processing


    【解决方案1】:

    它们完全代表了名称所暗示的含义:

    detection_boxes:预测对象的坐标。通常它们代表:xmin,xmax,ymin,ymax。

    detection_scores:准确的每个预测的分数,即模型有 69% 的把握确定某张图片代表一张 A 牌。

    detection_classes:代表预测的标签。

    num_detections:模型在给定阈值的情况下能够预测的检测次数。

    【讨论】:

      猜你喜欢
      • 2018-06-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-08-01
      • 1970-01-01
      • 2017-12-02
      • 1970-01-01
      相关资源
      最近更新 更多