
独立性检验公式
-
2023年2月25日发(作者:悼亡诗)WORD格式
专业资料整理
概率与统计
一、普通的众数、平均数、中位数及方差
1、众数:一组数据中,出现次数最多的数。
2、平均数:①、常规平均
数:
x
x
1x2xn
②、加权平均
数:
x
x1
1
x2
2
x
nn
n12n
3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数
。
4、方差:s2
1
[(x1x)2
(x
2x)2(xnx)2]
n
二、频率直方分布图下的频率
1、频率=小长方形面积:
f
S
y距d;频率=频数/
总数
2、频率之和:f1
f2fn1
;同时
S1S2Sn1;
三、频率直方分布图下的众数、平均数、中位数及方差
1、众数:最高小矩形底边的中点。
2、平均数:
xx1f1
x2f
2x3
f
3
xnf
nxx1S1x2S2x3S3xnSn
3、中位数:从左到右或者从右到左累加,面积等于
0.5
时x的值。
4、方差:s2
(x
1
x)
2
f1
(x2x)2f2(xnx)2fn
四、线性回归直线方程
:?
?
?
bx
ya
n
(xi
x)(
yi
y
)
nxiyi
nxy
??
其中:b
i
1i1
,
a?
ybx
nn
(xix)2
xi
2nx2
i
1i1
1、线性回归直线方程必过样本中心
(x,
y);
??
0:负相关。
2、b0:正相关;
b
?
3、线性回归直线方程:
y?
?
bx
a?的斜率b中,两个公式中分子、分母对应也相等;中间可以推导得到。
五、回归分析
?i1、残差:?i
y
i
?i越小越好;
ey(残差=真实值—预报值)。分析:
e
2、残差平方和:
n
?)
2(
yi,
i
1
yi
n
(
yi
y
)
2
(y
1
y
)
2
(yy)
2
(
y
y
)
2
分析:①意义:越小越好;②计算:
?i?1
2
?2
n
?n
i
1
n
?i
)
2
i
3、拟合度(相关指数):R
21
(yy
,分析:①.R20,1
②.越大拟合度越高;
i1
的常数;
WORD格式
专业资料整理
n
y)2
i
(yi
1
nn
4、相关系数:
r
i
(xi
x)(y
iy)
xi
yinxy
1
i
1
n
x)2
n
y)2
n
x)2
n
y)2
i
1
(xi
i
(
yi(xi
(
yi
1
i
1i1
分析:①.r
[1,1]的常
数;
②.
r0:正相关;r0:负相关
③.r
[0,0.25]
;相关性很弱;
r
(0.25,0.75);相关性一般;
r
[0.75,1];相关性很
强;
六、独立性检验
x1x2
1、2×2列联表:
合计
2、独立性检验公式
bc)2
y1abab
①.k2
(a
n(ad
d)
y2cdcd
b)(cd)(ac)(b
合计
acbdn
②.犯错误上界P对照表
3、独立性检验步骤
WORD格式
专业资料整理
①.计算观察值
n(adbc)2
k:k;
(ab)(cd)(ac)(bd)
②.查找临界值k0:由犯错误概率P,根据上表查找临界
值
k0;
③.下结论:k
k0:即犯错误概率不超过
P的前提下认为:,有1-P以上的把握认为:
;
kk0:即犯错误概率超过
P的前提认为:
,
没有1-P以上的把握认为:
;
【经典例题】
题型1与茎叶图的应用
例1(2014全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50位市民。根据这
50位市
民
(1)分别估计该市的市民对甲、乙
部门评分的中位数;
(2)分别估计该市的市民对甲、乙
部门的评分做于90的概率;
(3)根据茎叶图分析该市的市民对
甲、乙学科网两部门的评价。
题型2频率直方分布图的应用
例2(2015广东)某城市
100
户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),
[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图
2,
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),
[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月
平均用电量在[220,240)的用户中应抽取多少户?
练习2(2014全国1)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得
如下频数分布表:
质量指标值分组
[75,85)[85,95)[95,105)[105,115)[115,125)
频数
62638228
WORD格式
专业资料整理
(1)在答题卡上作出这些数据的频率分布直方图:
(2)估计这种产品质量指标值的平均数及方差
(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生
产的这种产品符合“质量指标值不低于95的产
品至少要占全部产品的80%”的规定?
题型3
计算线性回归方程
例3(2015重庆)随着我国经济的发展,居民
的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
20132014
时间代号t
12345
储蓄存款y(千亿元)
567810
(1)求y关于t的回归方程???
ybta
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
练习3(2014全国2)某地区2007年至2013年农村居民家庭纯收
入y(单位:千元)的数据如下表:
年份
2013
年份代号t
1234567
人均纯收入y
2.93.33.64.44.85.25.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该
地区2015年农村居民家庭人均纯收入.
题型4线性回归分析
例4(2016全国3)下图是我国2008年至2014年生活垃圾
无害化处理量(单位:亿吨)的折线图.
注:年份代码1–7分别对应年份2008–2014.
(1).由折线图看出,可用线性回归模型拟合
y与t的关系,
请
用相关系数加以说明;
(2).求出y关于t的回归方程
y?
?
0.01),
bta?(系数精确到
预测2016年我国生活垃圾无害化处理量.
777y)2
WORD格式
专业资料整理
参考数据:
yi
9.32,
ti
yi40.17,
(yi
0.55,≈
2.646.
i1i1i1
WORD格式
专业资料整理
nn
(t
it)(yiy)(ti
t)(yi
y)
参考公式:r
i1
,回归方程y
abt中:b
i1
,a=ybt.
nn
n
t)
2y)2
(ti
t)2(ti
(y
i
i1
i
1i1
题型5独立性检验综合应用
例5.为了解某班学生喜爱打篮球是否与性别有关,
对本
班60人进行了问卷调查得到了如
下的
2×2列联表:
(1)用分层抽样的方法在喜爱打篮球的学生中抽6人,其中男生抽多少人?
(2)在上述抽取的人中选2人,求恰有一名女生的概率;
(3)你是否有95%的把握认为喜爱打篮球与性别有关?说明你的理由。
练习5.为调查某市学生百米运动成绩,从该市学生中按照男女比例
随机抽取50名学生进行百米测试,学生成绩全部都介于13秒到18秒之
间,将测试结果按如下方式分成五组,第一组13,14,第二组14,15,第
五组17,18,如图是按上述分组方法得到的频率分布直方图.
(1)求这次测试成绩的平均数、众数和中位数、
(2)设m,n表示从第一组和第五组的所有学生中任意抽取的两名学生的百
米测试成绩,即m,n13,1417,18,求事件“mn2”的概率;
(3)根据有关规定,成绩小于16秒为达标.如果男女生使用相同的达标标
准,则男女生达标情况如下
表
:
男女总计
完成上表,并根据上表数据,能否有99﹪的把握认为“体育达标与性
达标
24
别有关”?不达标
12
总计
50