PS.完整决策树算法原理及实现请戳☞[传送门]

一、基于树的方法

将特征空间划分成一系列长方形,然后对每个长方形拟合简单的模型(常数)
回归树的计算流程
拟合的模型为:
f^(x)=(m=1)5cmI{X1,X2Rm}\hat f(x)=\sum_{(m=1)}^5c_m I\{X_1,X_2∈R_m\}

二、 回归树的生成

(一个回归树对应着输入空间的一个划分以及在划分单元上的输出)
假设将输入空间划分为M个单元,R1R_1,R2R_2,⋯,RmR_m,那么每个区域输出值为cm=ave(yixiRm)c_m=ave(y_i |x_i∈R_m)(即区域内所有点的均值),由输入和输出得最小二乘的回归树。
回归树的计算流程
注:损失函数为:l(y,f(x))=〖(f(x)-y) 〗^2
目标:〖min〗s m(s)=min ⁡[min(c_1 )⁡〖l(y_i-c_1 )+min_(c_2 )⁡l(y_j-c_2 ) 〗]
回归树的计算流程
回归树的计算流程
得到,分割点s=6.5时得到最小损失函数,此时分割区域为:R1={1,2,3,4,5,6}R_1=\{1,2,3,4,5,6\}R2={7,8,9,10}R_2=\{7,8,9,10\}
输出值为c1c_1=6.24,c2c_2=8.91
对两个区域调用上述步骤,最终回归树为:
τ(x)={5.72x3.56.753.5<x6.58.91x>6.5\tau(x)=\begin{cases}5.72, x≤3.5\\6.75,3.5<x≤6.5\\8.91,x>6.5\end{cases}

三、CART回归树的分裂准则——最小方差法

对每个变量、根据不同的分割点计算二叉树两边分裂的数值均值,计算其方差,方差最小的分裂点为其最终分裂点,各个变量方差值对比,选择最小方差的变量作为分裂属性。

相关文章:

  • 2021-12-02
  • 2021-12-02
  • 2021-10-26
  • 2021-07-05
  • 2022-01-29
  • 2021-12-31
  • 2022-12-23
猜你喜欢
  • 2021-09-06
  • 2021-12-05
  • 2021-06-13
  • 2021-10-05
  • 2021-11-29
相关资源
相似解决方案