✅ 操作成功!

独立性检验公式

发布时间:2023-06-08 作者:admin 来源:文学

独立性检验公式

独立性检验公式

-

2023年2月25日发(作者:悼亡诗)

WORD格式

专业资料整理

概率与统计

一、普通的众数、平均数、中位数及方差

1、众数:一组数据中,出现次数最多的数。

2、平均数:①、常规平均

数:

x

x

1x2xn

②、加权平均

数:

x

x1

1

x2

2

x

nn

n12n

3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数

4、方差:s2

1

[(x1x)2

(x

2x)2(xnx)2]

n

二、频率直方分布图下的频率

1、频率=小长方形面积:

f

S

y距d;频率=频数/

总数

2、频率之和:f1

f2fn1

;同时

S1S2Sn1;

三、频率直方分布图下的众数、平均数、中位数及方差

1、众数:最高小矩形底边的中点。

2、平均数:

xx1f1

x2f

2x3

f

3

xnf

nxx1S1x2S2x3S3xnSn

3、中位数:从左到右或者从右到左累加,面积等于

0.5

时x的值。

4、方差:s2

(x

1

x)

2

f1

(x2x)2f2(xnx)2fn

四、线性回归直线方程

:?

?

?

bx

ya

n

(xi

x)(

yi

y

)

nxiyi

nxy

??

其中:b

i

1i1

,

a?

ybx

nn

(xix)2

xi

2nx2

i

1i1

1、线性回归直线方程必过样本中心

(x,

y);

??

0:负相关。

2、b0:正相关;

b

?

3、线性回归直线方程:

y?

?

bx

a?的斜率b中,两个公式中分子、分母对应也相等;中间可以推导得到。

五、回归分析

?i1、残差:?i

y

i

?i越小越好;

ey(残差=真实值—预报值)。分析:

e

2、残差平方和:

n

?)

2(

yi,

i

1

yi

n

(

yi

y

)

2

(y

1

y

)

2

(yy)

2

(

y

y

)

2

分析:①意义:越小越好;②计算:

?i?1

2

?2

n

?n

i

1

n

?i

)

2

i

3、拟合度(相关指数):R

21

(yy

,分析:①.R20,1

②.越大拟合度越高;

i1

的常数;

WORD格式

专业资料整理

n

y)2

i

(yi

1

nn

4、相关系数:

r

i

(xi

x)(y

iy)

xi

yinxy

1

i

1

n

x)2

n

y)2

n

x)2

n

y)2

i

1

(xi

i

(

yi(xi

(

yi

1

i

1i1

分析:①.r

[1,1]的常

数;

②.

r0:正相关;r0:负相关

③.r

[0,0.25]

;相关性很弱;

r

(0.25,0.75);相关性一般;

r

[0.75,1];相关性很

强;

六、独立性检验

x1x2

1、2×2列联表:

合计

2、独立性检验公式

bc)2

y1abab

①.k2

(a

n(ad

d)

y2cdcd

b)(cd)(ac)(b

合计

acbdn

②.犯错误上界P对照表

3、独立性检验步骤

WORD格式

专业资料整理

①.计算观察值

n(adbc)2

k:k;

(ab)(cd)(ac)(bd)

②.查找临界值k0:由犯错误概率P,根据上表查找临界

k0;

③.下结论:k

k0:即犯错误概率不超过

P的前提下认为:,有1-P以上的把握认为:

;

kk0:即犯错误概率超过

P的前提认为:

,

没有1-P以上的把握认为:

;

【经典例题】

题型1与茎叶图的应用

例1(2014全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50位市民。根据这

50位市

(1)分别估计该市的市民对甲、乙

部门评分的中位数;

(2)分别估计该市的市民对甲、乙

部门的评分做于90的概率;

(3)根据茎叶图分析该市的市民对

甲、乙学科网两部门的评价。

题型2频率直方分布图的应用

例2(2015广东)某城市

100

户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),

[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图

2,

(1)求直方图中x的值;

(2)求月平均用电量的众数和中位数;

(3)在月平均用电量为[220,240),[240,260),[260,280),

[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月

平均用电量在[220,240)的用户中应抽取多少户?

练习2(2014全国1)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得

如下频数分布表:

质量指标值分组

[75,85)[85,95)[95,105)[105,115)[115,125)

频数

62638228

WORD格式

专业资料整理

(1)在答题卡上作出这些数据的频率分布直方图:

(2)估计这种产品质量指标值的平均数及方差

(同一组中的数据用该组区间的中点值作代表);

(3)根据以上抽样调查数据,能否认为该企业生

产的这种产品符合“质量指标值不低于95的产

品至少要占全部产品的80%”的规定?

题型3

计算线性回归方程

例3(2015重庆)随着我国经济的发展,居民

的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:

年份

20132014

时间代号t

12345

储蓄存款y(千亿元)

567810

(1)求y关于t的回归方程???

ybta

(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.

练习3(2014全国2)某地区2007年至2013年农村居民家庭纯收

入y(单位:千元)的数据如下表:

年份

2013

年份代号t

1234567

人均纯收入y

2.93.33.64.44.85.25.9

(1)求y关于t的线性回归方程;

(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该

地区2015年农村居民家庭人均纯收入.

题型4线性回归分析

例4(2016全国3)下图是我国2008年至2014年生活垃圾

无害化处理量(单位:亿吨)的折线图.

注:年份代码1–7分别对应年份2008–2014.

(1).由折线图看出,可用线性回归模型拟合

y与t的关系,

用相关系数加以说明;

(2).求出y关于t的回归方程

y?

?

0.01),

bta?(系数精确到

预测2016年我国生活垃圾无害化处理量.

777y)2

WORD格式

专业资料整理

参考数据:

yi

9.32,

ti

yi40.17,

(yi

0.55,≈

2.646.

i1i1i1

WORD格式

专业资料整理

nn

(t

it)(yiy)(ti

t)(yi

y)

参考公式:r

i1

,回归方程y

abt中:b

i1

,a=ybt.

nn

n

t)

2y)2

(ti

t)2(ti

(y

i

i1

i

1i1

题型5独立性检验综合应用

例5.为了解某班学生喜爱打篮球是否与性别有关,

对本

班60人进行了问卷调查得到了如

下的

2×2列联表:

(1)用分层抽样的方法在喜爱打篮球的学生中抽6人,其中男生抽多少人?

(2)在上述抽取的人中选2人,求恰有一名女生的概率;

(3)你是否有95%的把握认为喜爱打篮球与性别有关?说明你的理由。

练习5.为调查某市学生百米运动成绩,从该市学生中按照男女比例

随机抽取50名学生进行百米测试,学生成绩全部都介于13秒到18秒之

间,将测试结果按如下方式分成五组,第一组13,14,第二组14,15,第

五组17,18,如图是按上述分组方法得到的频率分布直方图.

(1)求这次测试成绩的平均数、众数和中位数、

(2)设m,n表示从第一组和第五组的所有学生中任意抽取的两名学生的百

米测试成绩,即m,n13,1417,18,求事件“mn2”的概率;

(3)根据有关规定,成绩小于16秒为达标.如果男女生使用相同的达标标

准,则男女生达标情况如下

:

男女总计

完成上表,并根据上表数据,能否有99﹪的把握认为“体育达标与性

达标

24

别有关”?不达标

12

总计

50

👁️ 阅读量:0