
线性回归计算器
液态金属-学前班语文
2023年2月18日发(作者:抱团游戏规则)高三数学线性回归
线性回归
重点难点讲解:
1.回归分析:
就是对具有相关关系的两个变量之间的关系形式进行测定,
确定一个相关的数学表达式,以便进行估计预测的统计分析
方法。根据回归分析方法得出的数学表达式称为回归方程,
它可能是直线,也可能是曲线。
2.线性回归方程
设x与y是具有相关关系的两个变量,且相应于n组观测值
的n个点(xi,yi)(i=1,......,n)大致分布在一条直线的
附近,则回归直线的方程为。
其中。
3.线性相关性检验
线性相关性检验是一种假设检验,它给出了一个具体检验y
与x之间线性相关与否的办法。
①在课本附表3中查出与显著性水平0.05与自由度n-2(n
为观测值组数)相应的相关系数临界值r0.05。
②由公式,计算r的值。
③检验所得结果
如果|r|≤r0.05,可以认为y与x之间的线性相关关系不显
著,接受统计假设。
如果|r|r0.05,可以认为y与x之间不具有线性相关关系的
假设是不成立的,即y与x之间具有线性相关关系。
典型例题讲解:
例1.从某班50名学生中随机抽取10名,测得其数学考试
成绩与物理考试成绩资料如表:序号数学成绩
54666876788285879094
物理成绩61828896
试建立该10名学生的物理成绩对数学成绩的线性回归模型。
解:设数学成绩为x,物理成绩为,则可设所求线性回归模
型为,
计算,代入公式得
∴所求线性回归模型为=0.74x+22.28。
说明:将自变量x的值分别代入上述回归模型中,即可得到
相应的因变量的估计值,由回归模型知:数学成绩每增加1
分,物理成绩平均增加0.74分。大家可以在老师的帮助下
对自己班的数学、化学成绩进行分析。
例2.假设关于某设备的使用年限x和所支出的维修费用y
(万元),有如下的统计资料:x23456y2.23.85.56.57.0
若由资料可知y对x成线性相关关系。试求:
(1)线性回归方程;(2)估计使用年限为10年时,维
修费用是多少?
分析:本题为了降低难度,告诉了y与x间成线性相关关系,
目的是训练公式的使用。
解:(1)列表如下:
i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.
049162536
于是b=,。∴线性回归方程为:=bx+a=1.23x+0.08。
(2)当x=10时,=1.23×10+0.08=12.38(万元)
即估计使用10年时维修费用是12.38万元。
说明:本题若没有告诉我们y与x间是线性相关的,应首先
进行相关性检验。如果本身两个变量不具备线性相关关系,
或者说它们之间相关关系不显著时,即使求出回归方程也是
没有意义的,而且其估计与预测也是不可信的。
例3.某省七年的国民生产总值及社会商品零售总额如下表
所示:已知国民生产总值与社会商品的零售总额之间存在线
性关系,请建立回归模型。年份国民生产总值(亿元)
社会商品零售总额(亿元)
1985396.26205.821986442.04227.951987517.77268.661988
625.10337.521989700.83366.001990792.54375.111991858.
47413.18合计4333.012194.24
解:设国民生产总值为x,社会商品零售总额为y,设线性
回归模型为。
依上表计算有关数据后代入的表达式得:
∴所求线性回归模型为y=0.445957x+37.4148,表明国民生
产总值每增加1亿元,社会商品零售总额将平均增加
4459.57万元。
例4.已知某地每单位面积菜地年平均使用氮肥量xkg与每
单位面积蔬菜每年平均产量yt之间的关系有如下数据:年
份
7019911992x(kg)709
5y(t)5.16.06.87.89.010.210.012.0年份
5871999x(kg)921381
45y(t)11.511.011.812.212.512.813.0
(1)求x与y之间的相关系数,并检验是否线性相关;
(2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直
线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜
的年平均产量。
分析:(1)使用样本相关系数计算公式来完成;(2)查表
得出显著水平0.05与自由度15-2相应的相关系数临界值
r0.05比较,若rr0.05,则线性相关,否则不线性相关。
解:(1)列出下表,并用科学计算器进行有关计算:
i1234567891xi7231
30138145yi5.16.06.87.89.010.210.012.011.511.011.812.
212.512.813.0xiyi357444544608.4765938.49
8813571500.616251766.41885
,.
故蔬菜产量与施用氮肥量的相关系数:
r=
由于n=15,故自由度15-2=13。由相关系数检验的临界值表
查出与显著水平0.05及自由度13相关系数临界值
r0.05=0.514,则rr0.05,从而说明蔬菜产量与氮肥量之间
存在着线性相关关系。
(2)设所求的回归直线方程为=bx+a,则
∴回归直线方程为=0.0931x+0.7102。
当x=150时,y的估值=0.0931×150+0.7102=14.675(t)。
说明:求解两个变量的相关系数及它们的回归直线方程的计
算量较大,需要细心谨慎计算,如果会使用含统计的科学计
算器,能简单得到,这些量,也就无需有制表这一步,直接
算出结果就行了。另外,利用计算机中有关应用程序也可以
对这些数据进行处理。