✅ 操作成功!

独立性检验

发布时间:2023-06-12 作者:admin 来源:文学

独立性检验

独立性检验

-

2023年3月17日发(作者:人民币银行结算账户管理办法)

第4节独立性检验

课标要求掌握运用二维列联表的方法,领会独立性检验的基本思想,解决独立性检验的实

际问题.

知识衍化体验

知识梳理

1.利用2统计量来研究“两个对象Ⅰ和Ⅱ是否______”的方法称为独立性检验.

2.22列联表:一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B,Ⅱ也

有两类取值,即类1和类2.我们得到如下22列联表所示的抽样数据:

类1类2合计

类Aab

ab

类Bcd

cd

合计

acbd

3.推断“Ⅰ与Ⅱ有关系”的步骤为:

(1)提出假设H

0

:Ⅰ与Ⅱ没有关系;

(2)根据22列联表与公式2______,其中样本容量nabcd,计算2的值;

(3)查对临界值表,作出判断.

2

0

Px≥

0.500.400.250.150.100.050.0250.0100.0050.001

0

x

0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

例如:

①如果2≤2.706,那么就认为没有充分证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H

0

成立”,即Ⅰ与Ⅱ没有关系;

②如果22.706,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;

③如果23.841,那么有95%的把握认为“Ⅰ与Ⅱ有关系”;

……

⑥如果210.828,那么有______的把握认为“Ⅰ与Ⅱ有关系”.

4.假设检验的原理:

在一个假设下,如果一个与该假设矛盾的小概率事件发生,那么就推断这个假设______.

5.独立性检验所采用的思想:

要研究“Ⅰ与Ⅱ有关系”这一结论的可靠程度,先假设该结论不成立,在该假设下构造2统

计量.如果2观测值很_____,那么在一定程度上说明假设不合理.根据2的含义,通过查

对临界值表评价假设不合理的程度.

【微点提醒】

1.利用2进行独立性检验,可以对推断的正确性的概率作出估计,在实际应用中,抽样数

据a,b,c,d应均不小于5.n越大,估计越准确;n很小时,估计不一定可靠,需要进行

近一步检验措施.

2.这里所说的“Ⅰ与Ⅱ有关系”是一种统计关系,指的是“Ⅰ与Ⅱ有关系”的可能性,不

是必然关系.

基础自测

疑误辨析

1.判断下列结论的正误(在括号内打“√”或“×”)

(1)Ⅰ与Ⅱ关系越密切,则由观测数据计算得到的2值越大.()

(2)假设检验的原理与反证法原理相似.()

(3)在假设H

0

成立的情况下,26.6350.01P≥

表明对2进行多次观测,观测值超过

6.635的频率约为0.01.()

(4)如果2观测值很大,那么在一定程度上说明假设不合理.()

(5)如果2值不大于0,那么Ⅰ与Ⅱ一定没有关系.()

教材衍化

2.为了鉴定新疫苗的效果,将60只豚鼠随机分为两组,其中在一组接种疫苗后,两组都

注射了病毒源,其结果列于下表:

则应提出统计假设H

0

A.疫苗有效B.疫苗无效

C.疫苗可能有效D.疫苗可能无效

发病没发病合计

接种32730

没接种171330

合计204060

3.66名学生的英语考试成绩与数学考试成绩如下表:

经过计算,

21.2785,则在显著性水平为0.05的前提下,()

A.有95%的把握认为英语成绩与数学成绩有关

B.有25%~40%的把握认为英语成绩与数学成绩有关

C.英语成绩与数学成绩没有关系

D.不能作出英语成绩与数学成绩有关的结论

考题体验

4.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22列

联表进行独立性检验,经计算26.705,则所得到的统计学结论是:有______的把握

认为“学生性别与支持该活动没有关系”

A.99.9%B.99%C.1%D.0.1%

5

.(

2019

全国

1

文)某商场为提高服务质量,随机调查了

50

名男顾客和

50

名女顾客,每

位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:

满意不满意

男顾客

4010

女顾客

3020

1

)分别估计男、女顾客对该商场服务满意的概率;

2

)能否有

95%

的把握认为男、女顾客对该商场服务的评价有差异?

附:

2

2

()

()()()()

nadbc

acbdabcd



2

0

Px≥

0.0500.0100.001

0

x3.8416.63510.828

6.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关

系,随机抽查52名中学生,得到统计数据如表1~表4,则与性别有关联的可能性最大

及格不几个合计

英语61566

数学57966

合计11814132

2

0

Px≥

0.100.050.0250.0100.001

0

x

2.7063.8415.0246.63510.828

的变量是

考点一22列联表的统计意义

【例1】(2010新课标理)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方

法从该地区调查了500位老年人,结果如下:

是否需要志愿性别男女

需要4030

不需要160270

(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;

(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?

(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老

年人的比例?说明理由.

附:

2

2

()

()()()()

nadbc

acbdabcd



2

0

Px≥

0.0500.0100.001

0

x3.8416.63510.828

规律方法

1.根据公式计算2观测值,并对照临界值表进而给出判断结果;

2.利用计算结果,可以更好地优化调查方法,提高统计的实际价值.

【训练1】为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,

得到如下成22列联表:

已知23.8410.05P≥

,25.0240.025P≥

.根据表中数据,得到

2

250(1320107)

23272030





4.844,则认为选修文科与性别有关系出错的可能性为______.

考点二独立性检验的应用

【例2】(2019湖南长沙雅礼中学、河南省实验中学联考)环境问题是当今世界共同关注

的问题,我国环保总局根据空气污染指数PM2.5浓度,制定了空气质量标准:

空气污染指数

050,50100,100150,150200,200300,300,

空气质量等级优良轻度污染中度污染重度污染严重污染

某市政府为了打造美丽城市,节能减排,从2010年开始考察了连续六年11月份的空气污染

指数,绘制了频率分布直方图,经过分析研究,决定从2016年11月1日起在空气质量重度

理科文科

男1310

女720

污染和严重污染的日子对机动车辆限号出行,即车牌尾号为单号的车辆单号出行,车牌尾号

为双号的车辆双号出行(尾号是字母的,前13个视为单号,后13个视为双号).王先生有

一辆车,若11月份被限行的概率为0.05.

(1)求频率分布直方图中m的值;

(2)若按分层抽样的方法,从空气质量等级为良与中度污染的天气中随机抽取6天,再从

这6天中随机抽取2天,求至少有一天空气质量是中度污染的概率;

(3)该市环保局为了调查汽车尾气排放对空气质量的影响,对限行两年来的11月份共60

天的空气质量进行统计,其结果如下表:

空气质量优良轻度污染中度污染重度污染严重污染

天数112711731

根据限行前6年180天与限行后60天的数据,计算并填写2×2列联表,并回答是否有90%

的把握认为空气质量的优良与汽车尾气的排放有关.

空气质量优、良空气质量污染总计

限行前

限行后

总计

参考数据:

2

0

Px≥

0.150.100.050.0250.0100.005

频率

组距

空气污染指数(3g/m)

250500

m

0.004

0.005

0.006

0

x

2.0722.7063.8415.0246.6357.879

参考公式:2

2()

()()()()

nadbc

acbdabcd



,其中

nabcd

规律方法

1.在22列联表中,如果两个变量没有关系,则应满足,adbc越小,说明两个变量之

间的关系越弱,adbc越大,说明两个变量之间的关系越强.

2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论,独立性检验的步

骤为:(1)根据样本数据制成22列联表;(2)根据公式

2

2

()

()()()()

nadbc

acbdabcd



算2观测值;(3)比较观测值与临界值的大小关系,作出统计推断.

【训练2】

海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100个网

箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:

新养殖法旧养殖法

频率/组距

箱产量/kg箱产量/kg

频率/组距

06570

0.068

0.046

0.044

0.020

0.010

0.008

0.004

703530250

0.040

0.034

0.032

0.024

0.020

0.014

0.012

(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,

新养殖法的箱产量不低于50kg”,估计A的概率;

(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有

关:

箱产量50kg

箱产量≥50kg

旧养殖法

新养殖法

附:

2

2

()

()()()()

nadbc

abcdacbd



2()PKk≥

0.0500.0100.001

k3.8416.63510.828

【例3】(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随

机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看

该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10

名女性.

(1)根据已知条件完成下面22列联表,并据此资料你是否认为“体育迷”与性别有关?

非体育迷体育迷合计

合计

(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育

迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.

附:

2

2

()

()()()()

nadbc

abcdacbd



规律方法

1.根据频率分布直方图获取2×2列联表中的数据,进而利用2公式计算判断;

2.古典概型要抓住所有等可能基本事件数和所求事件数进行求解.

【训练3】

)(2kP

0.050.01

k3.8416.635

在研究某种药物对“H7N9”病毒的治疗效果时,进行动物试验,得到以下数据,对150只

动物服用药物,其中132只动物存活,18只动物死亡,对照组150只动物进行常规治疗,

其中114只动物存活,36只动物死亡.

(1)根据以上数据建立一个2×2列联表.

(2)试问该种药物以治疗“H7N9”病毒是否有效?

反思与感悟

【思维升华】

1.独立性检验是根据2的值判断两个变量有关的可信程度;

2.独立性检验常与统计中的频率分布直方图、概率等自然交汇,不要割裂其内在联系.

【易错防范】

1.独立性检验中统计量2的观测值的计算公式较复杂,在解题中易混淆一些数据的意义,

代入公式时出错,而导致计算出错;

2.2的观测值如果不大于2.706,不能错误地理解为具体有多大可能性认为两个变量有关

系,而应理解为没有充分证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论Ⅰ与Ⅱ没有关系.

👁️ 阅读量:0