【发布时间】:2019-03-16 23:50:24
【问题描述】:
这可以在 Tensorflow 中实现标准化互信息吗?我想知道我是否可以做到这一点,以及我是否能够区分它。假设我在两个不同的张量中有预测 P 和标签 Y。有没有一种简单的方法来使用归一化互信息?
我想做类似的事情:
https://course.ccs.neu.edu/cs6140sp15/7_locality_cluster/Assignment-6/NMI.pdf
【问题讨论】:
-
如果你使用模型中的连续预测,仔细地对它们进行归一化(例如,使用 softmax),以便它们解释为在每个类中的概率,那么答案是肯定的,并且可以区分它们。如果将输出离散化,则它们是不可微的。谷歌交叉熵损失,了解如何计算连续 P 和离散 Y 之间的条件熵。
-
我认为你误解了我的问题。我想根据聚类标签和真实标签在我的图表中进行预测,而不是基于我的 logits 和真实标签。为了说明这一点:argmax(logits) = [4, 4, 3, 3, 2, 2, 1, 1] argmax(labels) = [1, 1, 2, 2, 3, 3, 4, 4]在这个例子中,交叉熵为 0,但是,聚类仍然非常好,因为我们将相同的类实例放在同一个集群中。标准化互信息给了我这个,但我不知道如何在 Tensorflow 中使用它。
标签: tensorflow cluster-analysis