一、相关系数的定义
样本的总平方和:TSS,样本的值与平均值差值的平方和;
残差平方和:RSS,误差平方和,定义如下":定义
可以得出结论:
值越大,拟合效果越好;最优值为1;若模型预测值为随机 值,可能为负值;若预测值恒为样本期望,其值为0;
二、Logistic回归
Logistic/sigmoid函数:
回归参数估计:
对数似然函数:
Logistic回归的损失函数:
Softmax回归:
三、分类器指标
混淆矩阵:
TPR和FPR定义:
ROC曲线示意图:
AUC定义:其值意义是指ROC曲线下的面积,取值范围在0~1,但其值只有大于0.5,模型才有意义;