【发布时间】:2022-01-03 13:39:28
【问题描述】:
逻辑回归背后的想法是估计后验类条件概率,给定 x 类 C_k 的观察值,使用 sigmoid f(C_k| x)=1/(1+exp(-w*x)) 来计算权重向量 w。
在我读过的每一本书(例如,Bishop 的 PRML)中,f(C_k| x) 是一个概率密度函数,但这绝对不是一个有效的 pdf,因为从负无穷到无穷的积分不等于 1(也不可能是通过任何归一化,因为积分是无限的)。
感谢您对此事的任何解释
【问题讨论】:
-
stats.stackexchange.com/questions/69820 和 stats.stackexchange.com/questions/91473 看起来他们可能会回答这个问题。另一种方法是对普通最小二乘回归提出相同的问题。现在响应密度为 $$f(y\mid x)=\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{1}{2\sigma^2}( y-\alpha-\beta x)^2\right).$$ 虽然您可以将它整合到所有 $x,$ 上,但您通常不会得到 $1$ 作为答案。问题是这个积分与回归无关,因为它在回归量 $x 上取某种平均值。$
-
$f(C_k|X=x)$ 是以 $X = x$ 为条件的类的概率质量函数,因此 $(X, C_k)$ 的联合分布为 $f (x)f(C_k|x)$,其中 $f(x)$ 是 $X$ 的 pdf 或 pmf。如果你对类求和并在 $X$ 上集成(求和)函数 $f(x)f(C_k|x)$,你应该得到 $1$,这不正确吗?在逻辑回归中,我们通常不关心$f(x)$,因为我们把$X$当作固定的,所以我们只建模$f(C_k|X)$。
-
您给出的逻辑函数是分布函数,而不是密度函数。分布范围从 0 到 1。逻辑密度是您给出的函数的导数。