Python SKLearn：逻辑回归概率答案

【问题标题】：Python SKLearn: Logistic Regression ProbabilitiesPython SKLearn：逻辑回归概率
【发布时间】：2013-12-24 22:11:00
【问题描述】：

我正在使用 Python SKLearn 模块执行逻辑回归。我有一个因变量向量 Y（从 M 个类中取值）和自变量矩阵 X（具有 N 个特征）。我的代码是

        LR = LogisticRegression()
        LR.fit(X,np.resize(Y,(len(Y))))

我的问题是，LR.coef_ 和 LR.intercept_ 代表什么。我最初认为他们持有 intercept(i) 和 coef(i,j) s.t. 的值。

log(p(1)/(1-p(1))) = intercept(1) + coef(1,1)*X1 + ... coef(1,N)*XN
.
.
.
log(p(M)/(1-p(M))) = intercept(M) + coef(M,1)*X1 + ... coef(M,N)*XN

其中p(i) 是具有[X1, ... ,XN] 特征的观察属于i 类的概率。但是，当我尝试转换时

V = X*LR.coef_.transpose()
U = V + LR.intercept_
A = np.exp(U)
A/(1+A)

所以A 是p(1) ... p(M) 的矩阵，用于X 中的观察。这应该是相同的值

LR.predict_proba(X)

但是它们很接近，但又不同。为什么是这样？

【问题讨论】：

如果让P = A/(1+A)，P / P.sum(axis=1).reshape((-1, 1))和predict_proba的输出是不是一模一样？
宾果游戏，没想到要测试添加到 1 的概率值...谢谢，如果您将此作为答案发布，我会接受。
逻辑回归不只估计一组 (N+1) 系数吗？即如果它们是相同的，为什么你有“coef(1,1)”和“coef(M,1)”？我错过了什么吗？
更准确地说，我可以说“多项逻辑回归”。关键是可以有多个可能的类或观察。

【解决方案1】：

coef_ 和 intercept_ 属性代表您的想法，您的概率计算因您忘记归一化而关闭：之后

P = A / (1 + A)

你应该这样做

P /= P.sum(axis=1).reshape((-1, 1))

【讨论】：