【发布时间】:2013-09-16 12:25:56
【问题描述】:
我有两个数组:
import numpy as np
a = np.array(['1','2','3'])
b = np.array(['3','4','1','5'])
我想计算联合熵。我找到了一些材料来制作它:
import numpy as np
def entropy(*X):
return = np.sum(-p * np.log2(p) if p > 0 else 0
for p in (np.mean(reduce(np.logical_and, (predictions == c for predictions, c in zip(X, classes))))
for classes in itertools.product(*[set(x) for x in X])))
似乎与len(a) = len(b) 可以正常工作,但如果len(a) != len(b) 则以错误结束
UPD:数组 a 和 b 是根据示例主输入创建的:
b:3 p1:1 p2:6 p5:7
b:4 p1:2 p7:2
b:1 p3:4 p5:8
b:5 p1:3 p4:4
数组 a 是从 p1 值创建的。因此,并非每一行都由每个 pK 组成,但每一行都有 b 属性。我需要为每个pK 计算互信息I(b,pK)。
【问题讨论】:
-
这只是一个猜测,但请确保 zip 是您想要的,而不是像 itertools.izip_longest 这样的东西。
-
你不能以这种方式构建一个 numpy 数组。也许缺少一对括号?另外:您的数据是什么类型(字符串还是整数?)。
-
@btel 我只是没有提到
import numpy as np和np.array([..])只是想向您展示我使用的数据类型。数据是 int chars(所以我认为使用什么都没关系)。 -
好的,但仍然缺少括号“(..)” - 所以你的语法是错误的。
-
条件熵也需要两个数组长度相等。事实上,您可以从联合熵和个体熵 -> H(X|Y) = H(X,Y) - H(Y) 计算它。如果您提供更多详细信息,也许会更容易提供帮助。