回归系数的解释
yi=β0+β1x1i+β2x2i+⋯+βkxki+μiyi=β0^+β2^x2i+⋯+βk^xkiβ0^的数值意义一般不考虑,因为所有的自变量一般不会同时全为0.βm^(m=1,2,⋯,k):控制其他自变量不变的情况下,xmi每增加一个单位,对yi造成的变化。实际上可以用数学中的偏导数来定义:βm^=∂xmi∂yi
因此多元线性回归模型中的回归系数,也常被称为偏回归系数。
什么时候取对数
- 与市场价值相关的,例如,价格、销售额、工资等都可以取对数;
- 以年度量的变量,如受教育年限、工作经历等通常不取对数;
- 比例变量,如失业率、参与率等,两者均可;
- 变量取值必须是非负数,如果包含0,则可以对y取对数ln(1+y);
取对数的好处
- 减弱数据的异方差性。
- 如果变量本身不符合正态分布,取了对数后可能渐近服从正态分布。
- 模型形式的需要,让模型具有经济学意义。
四种模型回归系数的解释


特殊的自变量:虚拟变量x
如果自变量中又定性变量,例如性别、地域等,在回归中需要如何处理呢?

虚拟变量的解释

为了避免完全多重共线性的影响,引入虚拟变量的个数一般是分类数减1
含有交互项的自变量
