机器学习简单梳理

线性模型通过特征属性的线性加权来预测，权重即表明属性特征重要性，具有较好的解释性

对于特征矩阵X当特征数目大于实例（列数大于行数）Xt * X 显然不满秩，则不存在逆矩阵，此时引入L2正则化参数，构成岭回归（B对应W）

对数函数将线性回归模型预测值跟类标记关联起来，形成分类效果

机器学习简单梳理

逻辑回归仍属于线性模型，logistic函数只是将线性模型预测与分类标志关联
关联函数必须连续光滑（便于求导，梯度下降求解），也是选择sigmoid函数的原因（任意阶可导）
逻辑回归不仅给出分类，同时给出分类的概率近似，名为回归，实则分类

牛顿法梯度下降解
机器学习简单梳理

LDA：样本从高维空间投影至低维空间，使得方差尽可能小（类内方差小，类间分隔大）
PCA：样本从高维空间投影至低维空间，使得方差尽可能小，保留原有数据信息量最大

机器学习简单梳理

最大化目标运用了类信息保类内方差小，类间方差大（属于有监督）

机器学习简单梳理

SVD分解求逆运算

机器学习简单梳理

多分类全局离散度以全局中心计算，每个类一类中心计算，二者之差作为类间离散度

机器学习简单梳理

最终实现形式：特征值对应的特征向量，取特征值大前K个，实现有监督降维（N->k）

机器学习简单梳理
- 多分类：OVO,OVR
- 类别不平衡：正例过抽样，负例欠抽样，阈值移动

ID3算法采用的信息增益对取值较多的属性有偏好，C4.5直接采用增益率对取值数目少的特征有偏好，因而采用先找出高于平均水平的信息增益的属性，再从中选择增益率最高的属性
决策树的过拟合问题：分支过多，通过剪枝解决
- 预剪枝：如果分支是的预测正确率下降则不展开分支，（局部贪心，全局次优，可能欠拟合）
- 后剪枝：回缩分支提高精度则回缩（西瓜书：精度回缩），回缩降低模型负度则回缩（统计学习方法：结构风险最小化）
决策树基于离散值划分，对连续值离散化处理（离散值属性分割之后，不可作为子树分个属性，连续值离散化后分割之后仍可作子树分隔属性）
- 对于缺失值属性，以其未缺失部分的信息增益乘以为缺失部分占总样本的比率作为属性的信息增益
- 对于缺失值样本，使其按照未缺失样本值分布概率加权进入各个节点