在 AWS SageMaker GroundTruth 中如何计算置信度分数？答案

【问题标题】：How are confidence scores calculated in AWS SageMaker GroundTruth?在 AWS SageMaker GroundTruth 中如何计算置信度分数？
【发布时间】：2020-08-09 04:04:26
【问题描述】：

AWS 的 SageMaker/GroundTruth 标签作业会为每个人工注释的标签返回一个 confidence score。
但是，分数并不是标记任务的 N 个工人的反应的直接函数。
例如，在所有三个工人分配不同标签的任务上，分数会有所不同（0.61、0.55、0.68）。在 2/3 同意的情况下，分数也有所不同（0.95，0.91）。

“自动数据标注”已禁用，表示所有项目均由人工标注，而非完全/部分自动分类。

AWS 如何计算这些置信度分数？

【问题讨论】：

标签： amazon-web-services amazon-sagemaker

【解决方案1】：

我找不到详细信息，因此请保留这个问题，希望得到真正的答案。但这是我目前能找到的：

每个标签作业都有一个 AnnotationConsolidationConfig 参数，可让您控制如何使用 AWS Lambda 函数计算置信度分数。

单图分类的默认描述为：

期望最大化方法的一种变体。
它估计每个工人的参数，并使用贝叶斯推理根据来自各个工人的类注释来估计真实的类。”

但是，由于缺乏权限，普通 AWS 用户似乎无法查看该函数本身。

【讨论】：