
多元回归模型
-
2023年3月17日发(作者:广告宣传方式)研究在线性关系相关性条件下,两个或者两个以上自变量对一个因变量,为多元线
性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模
型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上为
复杂需借助计算机来完成。
计算公式如下:
设随机
y
与一般变量
12
,,
k
xxx的线性回归模型为:
01122kk
yxxx
其中
01
,,
k
是1k个未知参数,
0
称为回归常数,
1
,
k
称为回归系数;
y称为被解释变量;
12
,,
k
xxx是k个可以精确可控制的一般变量,称为解释变量。
当1p时,上式即为一元线性回归模型,2k时,上式就叫做多元形多元回归
模型。是随机误差,与一元线性回归一样,通常假设
2
()0
var()
E
同样,多元线性总体回归方程为
01122kk
yxxx
系数
1
表示在其他自变量不变的情况下,自变量
1
x变动到一个单位时引起的因变
量
y
的平均单位。其他回归系数的含义相似,从集合意义上来说,多元回归是多维空间
上的一个平面。
多元线性样本回归方程为:
01122
ˆˆˆˆ
ˆ
kk
yxxx
多元线性回归方程中回归系数的估计同样可以采用最小二乘法。由残差平方和:
ˆ
()0SSEyy
根据微积分中求极小值得原理,可知残差平方和SSE存在极小值。欲使SSE达到
最小,SSE对
01
,,
k
的偏导数必须为零。
将SSE对
01
,,
k
求偏导数,并令其等于零,加以整理后可得到1k各方程
式:
ˆ
2()0
i
SSE
yy
0
ˆ
2()0
i
SSE
yyx
通过求解这一方程组便可分别得到
01
,,
k
的估计值
0
ˆ
,
1
ˆ
,···
ˆ
k
回归系
数的估计值,当自变量个数较多时,计算十分复杂,必须依靠计算机独立完成。现在,
利用
SPSS
,只要将数据输入,并指定因变量和相应的自变量,立刻就能得到结果。
对多元线性回归,也需要测定方程的拟合程度、检验回归方程和回归系数的显著性。
测定多元线性回归的拟合度程度,与一元线性回归中的判定系数类似,使用多重判
定系数,其中定义为:
2
2
2
()
11
()
yy
SSRSSE
R
SSTSST
yy
式中,
SSR
为回归平方和,
SSE
为残差平方和,
SST
为总离差平方和。
同一元线性回归相类似,201R,2R
越接近1,回归平面拟合程度越高,反之,
2R
越接近0,拟合程度越低。2R
的平方根成为负相关系数()R,也成为多重相关系数。
它表示因变量y与所有自变量全体之间线性相关程度,实际反映的是样本数据与预测数
据间的相关程度。判定系数2R
的大小受到自变量x的个数
k
的影响。在实际回归分析中
可以看到,随着自变量x个数的增加,回归平方和()SSR增大,是2R
增大。由于增加自
变量个数引起的2R
增大与你和好坏无关,因此在自变量个数
k
不同的回归方程之间比较
拟合程度时,2R
不是一个合适的指标,必须加以修正或调整。
调整方法为:把残差平方和与总离差平方和纸币的分子分母分别除以各自的自由
度,变成均方差之比,以剔除自变量个数对拟合优度的影响。调整的2R
为:
2
2
/(1)11
111(1)
/(1)11
SSEnkSSEnn
RR
SSTnSSTnknk
•
由上时可以看出,2R考虑的是平均的残差平方和,而不是残差平方和,因此,一
般在线性回归分析中,2R越大越好。
从F统计量看也可以反映出回归方程的拟合程度。将F统计量的公式与2R
的公式
作一结合转换,可得:
2
2
/
(1)/(1)
Rk
F
Rnk
可见,如果回归方程的拟合度高,F统计量就越显著;F统计量两月显著,回归方
程的拟合优度也越高。