二元逻辑回归
假设二元逻辑回归很容易;您对输入的每个特征都有权重,在训练后会增加或减少概率。
假设您有4 功能并输出0 或1。假设在训练之后,这些特征的系数分别是:
[0.0, -2.2, 1.3, -0.45]
在这里,您可以很容易地看到,如果特定示例的输入特征大于零(或者换句话说,特征 2与概率正相关)。
另一方面,第一个特征 (-2.2) 与概率负相关,而第零个特征无论其值如何都对概率结果没有影响。
您可以通过发布获得这些系数/权重
clf.coeffs_
前提是您的LogisticRegression 被命名为clf。
多项逻辑回归
一般来说,多项逻辑回归会有一个特征矩阵,每一行代表一个标签的概率。
再一次,假设您要将输入分类为5 类和34 输入特征之一,并假设学习的权重矩阵如下所示:
[
[0.1, 2.2, -0.1, 0.133], # Features of class 0
[-2, -1.1, 0, 4.56],
[-0.1, 0, 0.3, 0.4],
[3.3, -2, 15, -9.4],
[0.45, 0.5, 0.66, 5.5],
]
现在您可以应用与上述相同的想法;让我们看看每个4 特征如何影响输出标签3 的概率,所以我们采用这一行:
[3.3, -2, 15, -9.4]
您可以看到特征0和2与输出标签3的概率呈正相关,而特征1和3则为负相关。
偏差
偏见贡献了先验知识。假设所有权重都为零。在二进制情况下,只有一个偏差,因此它要么输出小(负偏差)概率,要么输出大(正偏差)概率。
在多项式情况下,每个类都有一个偏差,但它的工作原理相似。
系数的贡献
您可以将权重归一化到[-1, 1] 范围内,最大的负权重对输出零概率的影响最大,最大的正权重对输出一的概率影响最大。