目录


想法

先考虑二值的分类(预测结果只有好/坏,输/赢,行动/停留等等),再考虑多值的分类(预测结果含有两种以上情况:天气是晴/多云/下雨,心情是开心/悲伤/忧郁等等)
当有如下两组数据时
ML笔记——逻辑回归
ML笔记——逻辑回归
也像线性回归时那样,尝试用一个函数表达式将它表示出来。

数学表示

在逻辑回归中我们尝试用sigmoid函数(或logistic函数)去拟合,图像如下图
ML笔记——逻辑回归
结合所使用的数据,可以使用如下公式
{g(z)=11+ezhθ(x)=g(θTX)

hθ(x)=11+eθTX
其中θTX叫做决策边界,不做特别说明都指线性函数
通过代价函数表示θ取值的合理性
J(θ)=1mi=1mCost (hθ(xi),yi)
Cost (hθ(xi), yi)={log(hθ(xi))yi=1log(1hθ(xi))yi=0(本文中的logln等价)

J(θ)=1mi=1m[yilog(hθ(xi))+(1yi)log(1hθ(xi))]
并用梯度下降算法,取θminθJ(θ)
对于多值的分类,可以转换为二值处理
n种预测情况分别从总体数据人为的分离出来,做一次逻辑回归,得到hθi(x)(其中的i表示第i种预测情况)
对于需要作出预测的数据x,将得到maxihθi(x)的一个结果

胡思乱想时刻

  1. 为什么hθ(x)=11+eθTX能够比线性函数更好的拟合离散的数据

    首先,sigmoid函数的取值范围是(0,1),而线性函数的取值可能落在(0,1)之外
    其次,sigmoid函数又一个特殊点,如上图所示当x=0时,sigmoid函数的取值为0.5,将整个取值范围分成两份,这也恰好对应于我们所要求的y{0,1};对于线性函数,很难找到这样一个点或者说找到这样一个点不能达到预想的效果。

  2. 决策边界如何作用于sigmoid函数达到拟合数据集的目的

    第一问中提到,特殊点的位置决定了如何划分sigmoid函数的取值,那么选择合适的决策边界用以确定特殊点位置,就能划分数据集。
    利用sigmoid函数的性质,我们对hθ(x)=11+eθTX分析
    结合sigmoid图像,设hθ(x)<0.5时,y=0hθ(x)0.5时,y=1
    11+eθTX<12,也就是1+eθTX>2eθTX>1,两边取对数后,θTX>0
    也就是θTX<0时,y=0,同理,θTX0时,y=1
    结合图像来说就是,决策边界的两侧对应y的不同取值

    对于单变量x,如图
    ML笔记——逻辑回归
    如果取x=1时,就能将两个数据集分为左右两半,当x<1时,y=0,当x1时,y=1
    又如图,存在多个变量时,
    ML笔记——逻辑回归
    如果选取直线2x1+1.5x2=3,也能将两个数据集分开,当2x1+1.5x2<3时,y=0,当2x1+1.5x23时,y=1
    此外还适合于多项式的形式
    ML笔记——逻辑回归
    图中,当3x12+5x22<12时,y=0,当3x12+5x2212时,y=1
    :线性回归时,我们希望数据都落在线上;而逻辑回归时,我们希望数据都分散在线的两侧

  3. Cost (hθ(xi),yi)

    该类函数的选择,需要做到能反映预测值与真实值的差距,同时需要保证该函数f(x1)+f(x2)2f(x1+x22)(方便计算)
    虽然用(hθ(xi)yi)2能表示预测值与真实值的差距,但是不满足存在唯一的极小值点
    如果取Cost (hθ(xi), yi)={log(hθ(xi))y=1log(1hθ(xi))yi=0 那么满足上述的两个条件
    yi=0时,Cost(hθ(xi),yi)=log(1hθ(xi))
    已知hθ(x)(0,1),则1hθ(x)(0,1)
    Cost(hθ(xi),yi)=log(1hθ(xi))的图像如下
    ML笔记——逻辑回归
    当假设函数越接近0的时候,Cost函数越接近0;当假设函数越接近1时,Cost函数越趋于,也就是假设函数越接近0的时候,这个模型预测越正确
    再考虑到函数接近0时,y的取值
    所以,当yi=0时,用Cost(hθ(xi),yi)=log(1hθ(xi))表示偏差
    同理,当yi=1时,用Cost(hθ(xi),yi)=log(hθ(xi))表示偏差

  4. θ的过程

    利用梯度下降算法,求解θ
    θj=θjαθjJ(θ)
    hθ(x)=11+eθTX, 1hθ(x)=eθTX1+eθTX
    其中θjJ(θ)=1mi=1mθj[yilog(hθ(xi))+(1yi)log(1hθ(xi))]=1mi=1m[yi1hθ(xi)1(1+eθTX)2eθTXxji(1yi)11hθ(xi)1(1+eθTX)2eθTXxji]=1mi=1m[(yihθ(xi)+yi11hθ(xi))(1(1+eθTX)2eθTXxji)]=1mi=1m[yiyihθ(xi)hθ(xi)+yihθ(xi)hθ(xi)(1hθ(xi))1(1+eθTX)2eθTXxji]
    上式中hθ(xi)(1hθ(xi))=eθTX(1+eθTX)2
    得到原式θjJ(θ)=1mi=1m(hθ(xi)yi)xji

相关文章:

  • 2021-07-21
  • 2021-11-25
  • 2021-05-10
  • 2021-09-23
  • 2021-11-04
  • 2022-01-08
  • 2022-01-16
  • 2021-07-05
猜你喜欢
  • 2022-01-15
  • 2021-12-29
  • 2021-12-25
  • 2022-01-29
  • 2022-12-23
  • 2022-01-19
  • 2021-12-28
相关资源
相似解决方案