
独立性检验
-
2023年3月17日发(作者:人民币银行结算账户管理办法)第4节独立性检验
课标要求掌握运用二维列联表的方法,领会独立性检验的基本思想,解决独立性检验的实
际问题.
知识衍化体验
知识梳理
1.利用2统计量来研究“两个对象Ⅰ和Ⅱ是否______”的方法称为独立性检验.
2.22列联表:一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B,Ⅱ也
有两类取值,即类1和类2.我们得到如下22列联表所示的抽样数据:
Ⅱ
类1类2合计
Ⅰ
类Aab
ab
类Bcd
cd
合计
acbd
3.推断“Ⅰ与Ⅱ有关系”的步骤为:
(1)提出假设H
0
:Ⅰ与Ⅱ没有关系;
(2)根据22列联表与公式2______,其中样本容量nabcd,计算2的值;
(3)查对临界值表,作出判断.
2
0
Px≥
0.500.400.250.150.100.050.0250.0100.0050.001
0
x
0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828
例如:
①如果2≤2.706,那么就认为没有充分证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H
0
成立”,即Ⅰ与Ⅱ没有关系;
②如果22.706,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;
③如果23.841,那么有95%的把握认为“Ⅰ与Ⅱ有关系”;
……
⑥如果210.828,那么有______的把握认为“Ⅰ与Ⅱ有关系”.
4.假设检验的原理:
在一个假设下,如果一个与该假设矛盾的小概率事件发生,那么就推断这个假设______.
5.独立性检验所采用的思想:
要研究“Ⅰ与Ⅱ有关系”这一结论的可靠程度,先假设该结论不成立,在该假设下构造2统
计量.如果2观测值很_____,那么在一定程度上说明假设不合理.根据2的含义,通过查
对临界值表评价假设不合理的程度.
【微点提醒】
1.利用2进行独立性检验,可以对推断的正确性的概率作出估计,在实际应用中,抽样数
据a,b,c,d应均不小于5.n越大,估计越准确;n很小时,估计不一定可靠,需要进行
近一步检验措施.
2.这里所说的“Ⅰ与Ⅱ有关系”是一种统计关系,指的是“Ⅰ与Ⅱ有关系”的可能性,不
是必然关系.
基础自测
疑误辨析
1.判断下列结论的正误(在括号内打“√”或“×”)
(1)Ⅰ与Ⅱ关系越密切,则由观测数据计算得到的2值越大.()
(2)假设检验的原理与反证法原理相似.()
(3)在假设H
0
成立的情况下,26.6350.01P≥
表明对2进行多次观测,观测值超过
6.635的频率约为0.01.()
(4)如果2观测值很大,那么在一定程度上说明假设不合理.()
(5)如果2值不大于0,那么Ⅰ与Ⅱ一定没有关系.()
教材衍化
2.为了鉴定新疫苗的效果,将60只豚鼠随机分为两组,其中在一组接种疫苗后,两组都
注射了病毒源,其结果列于下表:
则应提出统计假设H
0
:
A.疫苗有效B.疫苗无效
C.疫苗可能有效D.疫苗可能无效
发病没发病合计
接种32730
没接种171330
合计204060
3.66名学生的英语考试成绩与数学考试成绩如下表:
经过计算,
21.2785,则在显著性水平为0.05的前提下,()
A.有95%的把握认为英语成绩与数学成绩有关
B.有25%~40%的把握认为英语成绩与数学成绩有关
C.英语成绩与数学成绩没有关系
D.不能作出英语成绩与数学成绩有关的结论
考题体验
4.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22列
联表进行独立性检验,经计算26.705,则所得到的统计学结论是:有______的把握
认为“学生性别与支持该活动没有关系”
A.99.9%B.99%C.1%D.0.1%
5
.(
2019
全国
1
文)某商场为提高服务质量,随机调查了
50
名男顾客和
50
名女顾客,每
位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意不满意
男顾客
4010
女顾客
3020
(
1
)分别估计男、女顾客对该商场服务满意的概率;
(
2
)能否有
95%
的把握认为男、女顾客对该商场服务的评价有差异?
附:
2
2
()
()()()()
nadbc
acbdabcd
.
2
0
Px≥
0.0500.0100.001
0
x3.8416.63510.828
6.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关
系,随机抽查52名中学生,得到统计数据如表1~表4,则与性别有关联的可能性最大
及格不几个合计
英语61566
数学57966
合计11814132
2
0
Px≥
0.100.050.0250.0100.001
0
x
2.7063.8415.0246.63510.828
的变量是
考点一22列联表的统计意义
【例1】(2010新课标理)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方
法从该地区调查了500位老年人,结果如下:
是否需要志愿性别男女
需要4030
不需要160270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老
年人的比例?说明理由.
附:
2
2
()
()()()()
nadbc
acbdabcd
2
0
Px≥
0.0500.0100.001
0
x3.8416.63510.828
规律方法
1.根据公式计算2观测值,并对照临界值表进而给出判断结果;
2.利用计算结果,可以更好地优化调查方法,提高统计的实际价值.
【训练1】为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,
得到如下成22列联表:
已知23.8410.05P≥
,25.0240.025P≥
.根据表中数据,得到
2
250(1320107)
23272030
4.844,则认为选修文科与性别有关系出错的可能性为______.
考点二独立性检验的应用
【例2】(2019湖南长沙雅礼中学、河南省实验中学联考)环境问题是当今世界共同关注
的问题,我国环保总局根据空气污染指数PM2.5浓度,制定了空气质量标准:
空气污染指数
050,50100,100150,150200,200300,300,
空气质量等级优良轻度污染中度污染重度污染严重污染
某市政府为了打造美丽城市,节能减排,从2010年开始考察了连续六年11月份的空气污染
指数,绘制了频率分布直方图,经过分析研究,决定从2016年11月1日起在空气质量重度
理科文科
男1310
女720
污染和严重污染的日子对机动车辆限号出行,即车牌尾号为单号的车辆单号出行,车牌尾号
为双号的车辆双号出行(尾号是字母的,前13个视为单号,后13个视为双号).王先生有
一辆车,若11月份被限行的概率为0.05.
(1)求频率分布直方图中m的值;
(2)若按分层抽样的方法,从空气质量等级为良与中度污染的天气中随机抽取6天,再从
这6天中随机抽取2天,求至少有一天空气质量是中度污染的概率;
(3)该市环保局为了调查汽车尾气排放对空气质量的影响,对限行两年来的11月份共60
天的空气质量进行统计,其结果如下表:
空气质量优良轻度污染中度污染重度污染严重污染
天数112711731
根据限行前6年180天与限行后60天的数据,计算并填写2×2列联表,并回答是否有90%
的把握认为空气质量的优良与汽车尾气的排放有关.
空气质量优、良空气质量污染总计
限行前
限行后
总计
参考数据:
2
0
Px≥
0.150.100.050.0250.0100.005
频率
组距
空气污染指数(3g/m)
250500
m
0.004
0.005
0.006
0
x
2.0722.7063.8415.0246.6357.879
参考公式:2
2()
()()()()
nadbc
acbdabcd
,其中
nabcd
.
规律方法
1.在22列联表中,如果两个变量没有关系,则应满足,adbc越小,说明两个变量之
间的关系越弱,adbc越大,说明两个变量之间的关系越强.
2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论,独立性检验的步
骤为:(1)根据样本数据制成22列联表;(2)根据公式
2
2
()
()()()()
nadbc
acbdabcd
计
算2观测值;(3)比较观测值与临界值的大小关系,作出统计推断.
【训练2】
海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100个网
箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
新养殖法旧养殖法
频率/组距
箱产量/kg箱产量/kg
频率/组距
06570
0.068
0.046
0.044
0.020
0.010
0.008
0.004
703530250
0.040
0.034
0.032
0.024
0.020
0.014
0.012
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,
新养殖法的箱产量不低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有
关:
箱产量50kg
箱产量≥50kg
旧养殖法
新养殖法
附:
2
2
()
()()()()
nadbc
abcdacbd
2()PKk≥
0.0500.0100.001
k3.8416.63510.828
【例3】(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随
机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看
该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10
名女性.
(1)根据已知条件完成下面22列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷体育迷合计
男
女
合计
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育
迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
附:
2
2
()
()()()()
nadbc
abcdacbd
规律方法
1.根据频率分布直方图获取2×2列联表中的数据,进而利用2公式计算判断;
2.古典概型要抓住所有等可能基本事件数和所求事件数进行求解.
【训练3】
)(2kP
0.050.01
k3.8416.635
在研究某种药物对“H7N9”病毒的治疗效果时,进行动物试验,得到以下数据,对150只
动物服用药物,其中132只动物存活,18只动物死亡,对照组150只动物进行常规治疗,
其中114只动物存活,36只动物死亡.
(1)根据以上数据建立一个2×2列联表.
(2)试问该种药物以治疗“H7N9”病毒是否有效?
反思与感悟
【思维升华】
1.独立性检验是根据2的值判断两个变量有关的可信程度;
2.独立性检验常与统计中的频率分布直方图、概率等自然交汇,不要割裂其内在联系.
【易错防范】
1.独立性检验中统计量2的观测值的计算公式较复杂,在解题中易混淆一些数据的意义,
代入公式时出错,而导致计算出错;
2.2的观测值如果不大于2.706,不能错误地理解为具体有多大可能性认为两个变量有关
系,而应理解为没有充分证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论Ⅰ与Ⅱ没有关系.