✅ 操作成功!

医学统计学第七版课后答案及解析

发布时间:2023-06-06 作者:admin 来源:文学

医学统计学第七版课后答案及解析

医学统计学第七版课后答案及解析

充电桩项目-交流调压电路

2023年2月20日发(作者:铁路网上售票系统)

医学统计学

第一章绪论

答案

名词解释:

(1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基

础上各观察单位(或个体)之间的差异。

(2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本

是从总体中随机抽取的部分观察单位。

(3)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称

为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为

样本统计量。

(4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误

差。

(5)概率:是描述随机事件发生的可能性大小的数值,用p表示

(6)计量资料:由一群个体的变量值构成的资料称为计量资料。

(7)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称

为计数资料。。

(8)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为

等级资料。

是非题:

1.×2.×3.×4.×5.√6.√7.×

单选题:

1.C2.E3.D4.C5.D6.B

第二章计量资料统计描述及正态分布

答案

名词解释:

1.平均数是描述数据分布集中趋势(中心位置)和平均水平的指标

2.标准差是描述数据分布离散程度(或变量变化的变异程度)的指标

3.标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布

称为标准状态分布。

4.参考值范围参考值范围也称正常值范围,医学上常把把绝

大多数的某指

标范围称为指标的正常值范围。

填空题:

1.计量,计数,等级

2.设计,收集资料,分析资料,整理资料。

3.



u(变量变换)标准正态分布、0、1

4.96.158.268.27%95%99%

5.47.5%

6.均数、标准差

7.全距、方差、标准差、变异系数

8.96.158.2

9.全距R

10.检验水准、显着性水准、0.05、0.01(0.1)

11.80%90%95%99%95%

12.95%99%

13.集中趋势、离散趋势

14.中位数

15.同质基础,合理分组

16.均数,均数,μ,σ,规律性

17.标准差

18.单位不同,均数相差较大

是非题:

1.×2.√3.×4.×5.×6.√7.√8.√9.√10.√

11.√12.√13.×14.√15.√16.×17.×18.×19.√20.√

21.√

单选题:

1.B2.D3.C4.A5.C6.D7.E8.A9.C10.D

11.B12.C13.C14.C15.A16.C17.E18.C19.D20.C

21.B22.B23.E24.C25.A26.C27.B28.D29.D30.D

31.A32.E33.D34.A35.D36.D37.C38.E39.D40.B

41.C42.B43.D44.C45.B

问答题:

1.均数﹑几何均数和中位数的适用范围有何异同?

答:相同点,均表示计量资料集中趋势的指标。

不同点:表2-5.

表2-5均数,几何均数和中位数的相异点

平均数意义应用场合

均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布

几何均数平均增减倍数①等比资料;②对数正态分布资料

中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两

察值水平端出现不确定值

2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?

答:

1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,

反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某

百分位置的水平,最常用的百分位是P

50

即中位数。多个百分位数结合使用,可

更全面地描述总体或样本的分布特征。

(2)计算:中位数和百分位数均可用同一公式计算,即

Px=L+(i/f

x

)(n·x%-Σf

L

可根据研究目的选择不同的百分位数代入公式进行计算分析。

(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考

值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中

更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。

3.同一资料的标准差是否一定小于均数?

答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。

变异大,标准差就大,有时比均数大;变异小,标准差小。

4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?

(1)样本含量的大小,样本含量越大,标准差越稳定。

(2)分组的多少

(3)分布形状的影响,偏态分布的标准差较近似正态分布大

(4)随机测量误差大小的影响

(5)研究总体中观察值之间变异程度大小

5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?

(1)概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的

连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边

对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示

方法不同,正态分布用N(μ,σ2)表示,标准正态分布用N(0,1)表示,对

数正态分布N(μ

lgX

,σ2

lgX

)表示。

(2)应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。

②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一

的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数

变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用

于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。

6.医学中参考值范围的含义是什么?确定的原则和方法是什么?

含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关

疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解

剖、生理、生化等数据绝大多数人的波动范围。

(2)原则:

①抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结

果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为

稳定的样本为原则。

②对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值

范围的前提。

③判定是否要分组(如男女、年龄、地区等)确定正常值范围。

④决定取双侧范围值还是单侧范围值。

⑤选择适当的百分范围

⑥确定可疑范围

⑦估计界值

(3)方法:

①百分位数法:P

x

=L+(i/f

x

)(n·x%-Σf

L

②正态分布法(对数正态分布):

百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近

似正态分布(服从对数正态分布)的资料。

7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?

答:不一定。均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正

态分布。

计算题:

1.某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:

4.773.376.143.953.564.234.314.715.694.12

4.564.375.396.305.217.225.543.935.216.51

5.185.774.795.125.205.104.7040743.504.69

4.384.896.255.324.504.633.614.444.434.25

4.035.854.093.354.084.795.304.973.183.97

5.165.105.864.795.344.244.324.776.366.38

4.865.553.044.553.354.874.175.855.165.09

4.524.384.314.585.726.554.764.614.174.03

4.473.043.912.704.604.095.965.484.404.55

5.383.894.604.473.644.345.186.143.244.90

3.05

(1)编制频数分布表,简述其分布特征。

①找出最大值、最小值求全距(R):

全距=最大值-最小值=7.22-2.70=4.50(mmol/L)

②求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L)

③分组段,划记(表1-1)

表2-6某地101例30~49岁健康男子血清总胆固醇值划记表

组段(mmol/L)划记频数

2.5~1

3.0~8

3.5~9

4.0~23

4.5~25

5.0~17

5.5~9

6.0~6

6.5~2

7.0~7.51

合计101

由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。

表2-7某地101例30~49岁健康男子血清总胆固醇值(mmol/L)X、s计算表

血清总胆组中值频数fXfX2累计累计频数

固醇值Xf频数(实际)

2.5~2.7512.757.56310.0099

3.0~3.25826.0084.50090.0891

3.5~3.75933.75126.563180.1782

4.0~4.252397.75415.438410.4059

4.5~4.7525118.75564.063660.6535

5.0~5.251789.25468.563830.8218

5.5~5.75951.75297.563920.9109

6.0~6.25637.50234.375980.9703

6.5~6.75213.5091.1251000.9901

7.0~7.57.2517.2552.5631011.0000

478.252242.315

注:Xu为组段上限值

(2)计算均数

X

、标准s、变异系数CV。

由上计算表1-2可见:ffXX/478.25/101=4.735(mmol/L)

1101

101/)25.478(313.23422

=0.882(mmol/L)

CV=xs/100%=0.882/4.735100%=18.627%

(3)计算中位数M,并与均数X比较,利用前表计算中位数M

M=L+(i/f

50

)(n50%-Σf

L

=4.5+(0.5/25)(10150%-41)=4.69(mmol/L)

本题算术均数为4.735(mmol/L),与中位数4.69(mmol/L)很接近,这也是

资料服从正态分布的特征之一。

(4)计算P2.5及P97.5并与X±1.96s的范围比较。

P

2。5

=3.0+(0.5/8)(1012.5%-1)=3.095(mmol/L)

P

97.5

=6.5+(0.5/2)(10197.5%-98)=6.619(mmol/L)

X1.96

S

=4.735±1.960.882=3.01~6.46(mmol/L)

用百分位数法求得101例30~49岁健康男子血清总胆固醇值95%分布范围

3.095~6.619(mmol/L),与正态分布法求得的95%分布范围3.01~6.46

(mmol/L)基本一致。

(5)分别考察X1

S

、X1.96

S

、X2.58

S

范围内的实际频数与理论分布是否基

本一致(表1-3)

表2-8某地101例30~49岁健康男子血清总胆固醇值理论分布与实际分布比较

usX血清总胆固醇实际分布理论分布

人数%%

sX13.85~5.627271.2968.27

sX96.13.01~6.469796.0495.00

sX58.22.46~7.0110099.0199.00

由上表,

sX1

范围内,实际分布与理论分布略有不同,而

sX96.1

sX58.2

范围内,实际分布与理论分布基本一致。

(6)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值

范围估计,其血清总胆固醇值是否正常?估计该地30~49岁健康男子中,

还有百分之几的人血清总胆固醇值比他高?

前计算得95%正常值为3.01~6.46(mmol/L)现测得一40岁男子的血清总

胆固醇值为6.993(mmol/L),在95%范围以外,故属于异常

u=(X-μ)/σ=(6.993-4.735)/0.882=2.56

因ф(2.56)=ф(-2.56),查表1得ф(-2.56)=0.0052

估计该地30~49健康男子中约有0.52%的人血清总胆固醇值比他高。

2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑

制抗体滴度资料如表2-9第(1)(2)栏。

表2-9平均滴度计算表

抗体滴度人数f滴度倒数X1lgX1flgX1

(1)(2)(3)(4)(5)=(2)×(4)

1:8280.90311.8062

1:166161.20417.2247

1:325321.50517.5257

1:6410641.806218.0618

1:12841282.10728.4288

1:25622562.40824.8165

1:51215122.70932.7093

合计3050.5730

(1)试计算其平均滴度。

由表1-4得,G=lg-1(50.5730/30)=lg-11.6858=48.5

该站30名麻疹易感儿童经气溶胶免疫一个月后,测得血凝抑制抗体平均滴度为

1:48.50

表2-10平均滴度计算表

抗体滴度人数f滴度倒数X

1

lgX

1

flgX

1

(1)(2)(3)(4)(5)=(2)(4)

1﹕8280.90311.8062

1﹕166161.20417.2247

1﹕325321.50517.5257

1﹕6410641.806218.0618

1﹕12841282.10728.4288

1﹕25622562.40824.8165

1﹕51215122.70932.7093

合计3050.5730

(2)有人发现本例用抗体滴度稀释倍数和直接用滴度(原书误为倒数)算得对

数值的标准差相同,为什么?

表2-11滴度对数值计算表

抗体滴度X

2

人数flgX

2

flgX

2

1﹕82-0.9031-1.8062

1﹕166-1.2041-7.2247

1﹕325-1.5051-7.5257

1﹕6410-1.8062-18.0618

1﹕1284-2.1072-8.4288

1﹕2562-2.4082-4.8165

1﹕5121-2.7093-2.7093

合计30-50.5730

1)由表1-4中数据计算标准差为:slgx

1

=lg-10.4444=2.7823

2)由表1-5中数据计算标准差为:slgx

2

=lg-10.4444=2.7823

直接用抗体滴度的对数lgx

2

与稀释倍数的对数lgx

1

计算标准差是相等的,因

为由上表可见lgx

2

=lg1-lgX

1

=-lgx

1

,而lgx

1

与-lgx

1

的离散程度是相同的,所以用

抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。

3.50例链球菌咽峡炎患者的潜伏期如表2-12,说明用均数、中位数或几何均数,

何者的代表性较好?并作计算。

表2-1250例链球菌咽峡炎患者的潜伏期的中位数计算表

潜伏期(小时)病例数f累计频数

12~11

24~78

36~1119

48~1130

60~7

72~5

84~4

96~2

108~1202

合计50

本例目测频数分布为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几

何均数表示其平均水平。

如上表,经计算中位数,几何均数、算术均数分别为:

M=54.55(小时),G=54.08(小时),X=58.56(小时)显然,算术均数受长潜

伏期的影响使其偏大,中位数M与几何均数G接近,故描述链球菌咽峡炎患者潜伏

期的集中趋势指标使用中位数M或几何均数G均可。

4.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查

了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量

如表2-13:

表2-13238人发汞含量频数计算表

发汞值人数f组中值XfXfX2累计频数累计频率

(μmol/kg)

1.5~202.550.0125.00208.40

3.5~664.5297.01336.508636.10

5.5~606.5390.02535.0014661.34

7.5~488.5408.03468.0019481.50

9.5~1810.5189.01984.5021289.08

11.5~1612.5200.02500.0022895.80

13.5~614.587.01261.5023498.32

15.5~116.516.5272.2523598.74

17.5~018.50.00.0023598.74

19.5~21.5320.561.51260.75238100.00

合计2381699.014743.50

(1).说明此频数分布的特征:可见发汞值的频数分布高峰位于第2个组段。前

4个组段的频数占总频数的81.5%,长尾拖向右侧,呈极度正偏态。

(2).计算均数和中位数M,何者较大?为什么?何者用语说明本资料的集中

位置较合适?

ffXX/=1699/238=7.139(μmol/kg)

M=L+(i/f

50

)(n50%-Σf

L

=5.5+2/60(23850%-86)=6.6(μmol/kg)

由计算结果得知,

MX

其原因因为本例呈正态分布,均数计算结果受到少

数较大发汞值的影响,使得X偏向大发汞值一边.本例用中位数描述偏态资

料的集中趋势较好,它不受两端较大值和极小值的影响.

(3).选用何种指标描述其离散程度较好

选用四分位数间距描述其离散程度较好.

(4).估计该地居民发汞值的95%参考值范围

本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大,

n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范

围较为合适.

P

95

=L+(i/f

95

)(n95%-Σf

L

)

=11.5+(2/16)(23895%-212)=13.2625(μmol/kg)

第三章均数的抽样误差与t检验

答案

填空题:

1.标准误

2.0.05,0.01

3.假设检验,(显着性检验)

4.两总体均数不同(越有理由说明有统计学意义)

5.自由度大小

6.一是准确度、二是精度

7.抽样误差、样本均数、总体均数

8.总体均数估计、假设检验

9.第二类错误(Ⅱ型错误)β

是非题:

1.√2.×3.×4.×5.√6.√7.×8.√9.×10.√

11.√12.×13.√14.√15.√16.√17.√18.√19.×20.×

21.×22.×

单选题:

1.A2.E3.D4.E5.E6.E7.D8.A9.D10.D

11.D12.B13.E14.D15.D16.E17.B18.C19.C20.D

21.C

问答题:

1.标准差和标准误有何区别和联系?

表3-6标准差与标准误的区别

标准差(α或s)标准误(

xsxa或

意义上描述一组变量值之间的离散趋势描述样本均数间的离散趋势

应用上①s越小,表示变量值围绕①xs越小,表示样本均数与

均值分布越密集,说明均数总体均数越接近,说明样本

的代表性越好。均数推断总体均数可靠性越大。

②可用suX

a

估计变量值分②可用xstX

va

,估计总体

布范围均数可信区间

与n的关系n越大,s越趋于稳定n越大,xs越小

(2)联系

①二者均是表示变异度大小的统计指标。

②标准误

n/x

与标准差大小成正比,与抽样例数n的平方根成反

比。

③当n一定时,同一份资料,标准差越大,标准误也越大。

2.可信区间和参考值范围有何不同?

参考值范围是指同质总体中个体变量值的分布范围,如X±1.96s说明有

95%的变量值分布在此范围内,它与标准差的大小有关,若个体变异越大,

该范围越宽,分布也就越散。而可信区间是指在可信度为(1-α)时,估

计总体参数可能存在的范围。即从同一总体中随机抽样,当n一定时,每

抽一次即可得一个样本均值,以xstX

va

,计算可信区间,如95%可信区间,

类似的随机抽样进行一百次,平均有95次,即有95个可信区间包括了总

体均数,有5次没有包括括总体均数,5%是小概率事件,实际发生的可能

性很小,因此实际应用中就认为总体均数在求得的可信区间。这种估计方

法犯错误的可能性最大不超过5%。可信区间与标准误大小有关,标准误越

大,可信区间则越大。

3.假设检验和区间估计有何联系?

假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间

是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信

区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比

假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为

假设检验可得到P值,比较精确地说明结论的概率保证,而可信区间只能告

诉我们在某α水准上有无统计意义,却不能像P那样提供精确的概率。因此,

只有将二者有机地结合起来,相互补充,才是完整的分析。

4.假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么

假设检验时,当P<0.05,则拒绝Ho,其理论依据是在Ho成立的条件下,

出现大于等于现有检验统计量的概率P<0.05,它是小概率事件,即在一次

抽样中得到这么小概率是事件是不大可能发生的,因而拒绝它。由此可见,

假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。

5.t检验和方差分析的应用条件有何异同?

(1)相同点:在均数比较中,t检验和方差分析均要求各样本来自正态总体;各处理

组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。

(1)不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可

进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方

差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。

6.怎样正确使用单侧检验和双侧检验?

根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可

能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心

其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有

探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率

高,但应慎用。

7.第一类错误与第二类错误的区别及联系何在?了解这两类错误有何实际意义?

(1)假设检验中Ⅰ、Ⅱ型错误的区别。

Ⅰ型错误是拒绝了实际上成立的Ho,也称为“弃真”错误,用α表

示。统计推断时,根据研究者的要求来确定。

Ⅱ型错误是不拒绝实际上不成立的Ho,也称为“存伪”错误,用β

表示。它只能与特定的H

1

结合起来才有意义,一般难以确切估计。

(2)Ⅰ、Ⅱ型错误的联系。

①当抽样例数一定时,α越大,β越小;反之,α越小,β越大。

②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,

可适当增加样本含量。

③根据研究者要求,n一定时,可通过确定α水平来控制β大小。

(3)了解两类错误的实际意义。

①可用于样本含量的估计。

②可用来计算可信度(1-α),表明统计推断可靠性的大小。

③可用于计算把握度(1-β),来评价检验方法的效能等。

④有助于研究者选择适当的检验水准。

⑤可以说明统计结论的概率保证。

计算题:

1.某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:

表3-7:健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算

性别例数均数标准差标准值变异系数(%)标准误

红细胞数男3604.660.584.8412.450.0306

(×1012/L)女2254.180.294.336.940.0182

血红蛋白男360134.57.1140.25.280.3742

(g/L)女255117.610.2124.78.670.6387

(1)说明女性的红细胞数与血红蛋白量的变异程度何者为大?

女性CV

RBC

=S/

x

×100%=0.29/4.18×100%=6.49%

CV

HB

=S/

x

×100%=10.2/117.6×100%=8.67%

由上计算可知该地女性血红蛋白量比红细胞数变异度大

(2)分别计算男﹑女两项指标的抽样误差。

见上表最后一栏,标准误计算公式nss

x

/。

(3)试估计该地健康成年男﹑女红细胞数的均数。

健康成年男子红细胞数总体均数95%可信区间为:

X

±1.96Sx=4.66±1.96×0.0306=4.60~4.72(1012/L)

其中n=360故近似按υ=∞。同理健康成年女子红细胞数总体均数95%可信区

间为4.14~4.22(1012/L)

(4)该地健康成年男﹑女间血红蛋白含量有无差别?

Ho:μ

H

1

:μ

≠μ

α=0.05

u=

255/2.10360/2.7/)6.1175.134()/()(22

2121

xxsXX=22.83

按υ=∞,查附表2,得P<0.0005,按α=0.05水准,拒绝Ho,接受H

1

,可

以认为男女间血红蛋白含量不同,男高于女。

2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月

的血沉(mm/小时)如下表,问:

(1)甲,乙两药是否均有效?

(2)甲,乙两药的疗效有无差别?

表3-8甲,乙两药治疗前后的血沉

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

病人号

甲━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

药治疗前19

治疗后693101042533

差值4431036326

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

病人号

乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

药治疗前9110

治疗后6353358274

差值37410512936

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

(1)甲,乙两药是否均有效?

经计算得:

甲药d=3.2000(mm/h)乙药d=5.0000(mm/h)

S

d

=1.9322(mm/h)S

d

=2.9810(mm/h)

S

d

=0.6110(mm/h)S

d

=0.9428(mm/h)

n=10n=10

Ho:μ

d

=0Ho:μ

d

=0

H

1

:μ

d

≠0H

1

:μ

d

≠0

α=0.05α=0.05

t

(甲药)

=d/S

d

=3.2000/0.6110=5.237

t

(乙药)

=d/S

d

=5.0000/0.9428=5.303

=9,查t界值表,得P<0.001,按α=0.05水准,拒绝Ho,接受H1

,故可认为

甲、乙两药均有效。

(2)甲,乙两药的疗效有无差别?

由表中资料分别求得治疗前后差值(见表3-8),再作两组比较。

H

0:

甲乙两药疗效相同

H

1:

甲乙两药疗效不同α=0.05

=18,查t界值表,得0.20>P>0.10,按α=0.05水准,不拒绝Ho,尚不能

认为甲乙两药疗效有差别。

3.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如

下,问两组的平均效价有无差别?

标准株(11人)116

水生株(9人)100

由题知:该资料服从对数正态分布,故得:

标准株水生株

n=11n=9

1lgxX=2.79362lgxX=2.2676

1lgxS

=0.45202lgxS

=0.2355

(1)两组方差齐性检验:

H

0:

2

2

2

1



H

1:

2

2

2

1



=0.05

F=684.32355.0/4520.0/2222

小大

SS

V

1

=10V

2

=8F

0.05(10,8)

=4.30

查附表3,得P>0.05,按α=0.05水准,不拒绝Ho,可以认为两总体方差齐。

(2)两组均数比较;

H

0

两总体几何均数相等

H

1

两总体几何均数不等

α=0.05

查t界值表,得0.01>P>0.005,按α=0.05水准,拒绝Ho,接受H

1

,故可认为钩

端螺旋体病人的血清用标准株和水生株作凝溶试验,前者平均抗体效价高于后者

4.表3-9为抽样调查资料,可做那些统计分析?

表3-9某地健康成人的第一秒肺通气量(FEV1)(L)

FEV

1

人数

男女

2.0~14

2.5~38

3.0~1123

3.5~2733

4.0~3620

4.5~2610

5.0~102

5.5~30

6.0~6.510

合计118100

(1)统计描述。

由上表可见,男性调查118人,第1秒肺通气量分布为2.0~6.5,高峰位于4.0~

4.5组段内,以中间频数分布最多,两侧逐渐减少,左右基本对称,其频数分布可

见上表和下图。女性调查100人,第1秒肺通气量分布为2.0~2.5,高峰位于3.5~

4.0组段内,以中间频数分布最多,两侧逐渐减少,且左右大体对称,频数分布可

见表3-9和图3-1。

图3-1某地健康成人第一秒肺通气量(FEV

1

)(L)分布

由上表和图可见,男性分布范围较宽,右侧尾部面积向外延伸两个组段,高峰

位置高于女性,向右推移一个组段。

(2)计算集中与离散趋势指标,并对两组进行比较。

Ho:男女间第1秒肺通气量总体均数相同

H

1

:男女间第1秒肺通气量总体均数不同

α=0.05

男性:n=118

1

X=4.2373s1

=0.6902

女性:n=100

2

X=3.7250s2

=0.6258

u=

2

2

21

2

1212121

///)(/)(nsnSXXxxsXX

=(4.2373-3.7250)/100/6258.0118/6902.022

=5.624

10

2.02.53.03.54.04.55.05.56.06.5

40

30

0

女男

20

查t界值表,v=∞,得P<0.001,按α=0.05水准,拒绝Ho,接受H

1

,故可认为

男女间第1秒肺通气量均数不同,男高于女。

(3)根据上述分析结果,分别确定95%参考值范围。

男性第1秒肺通气量单侧95%参考范围下限为:

suX

05.0

=4.2373-1.6450.6902=3.16(L)

即可认为有95%的男性第1秒肺通气量不低于3.16(L)

女性第1秒肺通气量单侧95%参考范围下限为:

suX

05.0

=3.7250-1.6450.6258=2.69(L)

即可认为有95%的女性第1秒肺通气量不低于2.69(L)

5.某医师就表3-10资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前,后

(接种后两月)血清抗体(黄疸出血型)的变化。

表3-10328例血清抗体滴度及统计量

抗体滴度的倒数

06401280

X

sxs

免疫前人数29376.1111.76.17

免疫后人数2523411.9470.525.90

t=(411.91-76.1)/2217.69.25=12.6>3,查t界值故P<0.01,说明接种后血

清抗体有增长。试问:

(2)本例属于何种类型设计?

本例属于自身配对设计。

(3)统计处理上是否妥当?

统计处理上不妥当,因为:①在整理资料过程中,未按配对设计整理,而是拆开

对子按成组设计整理,失去原设计的意义。②统计描述指标使用不当,血清浓度

是按倍比稀释,不适合计算算术均数、标准差、因为有零值,也不宜计算几何均数。

对现已整理好的资料,可计算中位数表示平均水平,用四分位数间距表示离散趋势。

③假设检验因本资料不宜计算均数,故对均数进行t检验当然是不妥当的。

6.152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计

和95%区间估计。

滴度倒数282565121024合计

人数2431152

以滴度倒数X的对数值求得X1gx=1.85965,Slgx=0.44245,n=152,则点值

估计G=lg-11.85965=72.39

患儿病后血清抗体滴度倒数总体均数95%可信区间为

lg-1(Xlgx+1.96Slgx/√n)

=lg-1(1.85965+1.96×0.44245/√152)

=lg-1

=61.5~85.11

7.某医院对9例慢性苯中毒患者用中草药抗苯1号治疗:

(1)得表白细胞总数(×109/L),问该药是否对患者的白细胞总数有影响?

表3-119例慢性苯中毒患者治疗前后的白细胞总数

病人号治疗前治疗后d1

16.04.21.8

24.85.4-0.6

35.06.3-1.3

43.43.8-0.4

57.04.42.6

63.84.0-0.2

76.05.90.1

83.58.0-4.5

94.35.0-0.7

H

0

该药对患者的白细胞总数无影响,即μ

d

=0

H

1

该药对患者的白细胞总数有影响,即μ

d

≠0

α=0.05

求得(前—后)差值d

i

经计算得:

d=0.3556S

d

=1.9951n=9

t=

534.0)9/9551.1/(3556.0)//(0nsd

d

=8查附表2,t界值表,得P>0.5,按α=0.05水准,不拒绝Ho,尚

不能认为该药对患者的白细胞总数有影响。

(2)同样得治疗后血小板比治疗前每人平均增加37.8×109/L,并算得

t=4.1,问该药是否对患者的血小板有影响?

H

0

该药对患者的血小板无影响,即μ

d

=0

H

1

该药对患者的血小板有影响,即μ

d

≠0

α=0.05

d=37.8t=4.1

=8

查附表2,t界值表,得0.005>P>0.002,按α=0.05水准,拒绝Ho,

接受H

1

,故可认为该药对患者的血小板有影响,可增加患者血小板。

(3)综合上述结果能否提出进一步研究意见/综合上述结果,提出以下建议:

①在此项研究中,从t检验结果来看,血小板治疗前后变化有意义,

而白细胞则无意义,可补充计算两项指标的95%可信区间,结合专

业知识,分析治疗前后指标差数有无实际意义。

②如有可能扩大样本,追踪观察该药对苯中毒患者的远期疗效

第四章方差分析

答案

填空题

1.各样本是相互独立的随机样本,各样本来自正态总体,

处理组总体方差相等(方差齐性)

2.总变异、组内变异、组间变异SS总=SS组间+SS组内

3.q检验(又称Newman-Keuls法)

4.V总=SS组间+SS组内

是非题:

1.×2.√3.×4.√5.×

单选题:

1.B2.D3.E4.B5.C6.A7.C8.C

计算题:

1.某湖水不同季节氯化物含量测定值如表2-4所示,问不同季节氯化物含量有无差

别?

表4-1:某湖水不同季节氯化物含量(mg/L)

春夏秋冬

22.619.118.919.0

22.822.813.616.9

21.024.517.217.6

16.918.015.114.8

20.015.216.613.1

21.918.414.216.9

21.520.116.716.2

21.221.219.614.8∑

∑Х

ij

167.9159.3131.9129.3588.4

n

i

888832

X20.9919.9116.4916.168.39

∑Х2

ij

3548.513231.952206.272114.1111100.84

S2

i

.52988.55554.50983.47125.0166

(1)多组均数间比较:

表1:方差分析表

变异来源SSvMSF

总变异281.63531

组间变异141.170347.0579.380

组内变异140.465285.017

查F界值表,得P<0.01,按0.05水准,拒绝H0,接受H1,故可认为不同季

节湖水中氯化物含量不同或不全相同。

(2)各组均数间两两比较

H0:μ

A

B

H1:μ

A

≠μ

B

α=0.05

表2四个样本均数顺序排例

组别春夏秋冬

X20.9919.9116.491

位次1234

表3四组均数两两比较q检验

对比组两均数之差组数q值P值

1与44.8346.099<0.01

1与34.5035.682<0.01

1与21.0821.364>0.05

2与43.7534.735<0.01

2与33.4224.319<0.01

3与40.3320.417>0.05

春与夏、秋与冬湖水中氯化物含量P>0.05,按α=0.05水准不拒绝Ho,即尚不能

认为春与夏、秋与冬季湖水中氯化物含量有差别。除这两对比组外,其它4组均P

<0.01,按α=0.05水准,拒绝Ho,接受H1,即可认为春夏两季湖水中氯化物含

量高于秋冬两季。

2.试就表4-2资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是

否会影响生存日数?

表4-2各组大鼠接种后生存日数

伤寒百日咳对照

568

769

8710

9810

10911

10912

111012

111014

121116∑

∑Хij9284112288

ni10101030

i

X9.28.411.29.6

∑2

ij

X88673213062924

2

i

s4.4002.9335.7334.3553

解Ⅰ:假定生存日数服从正态分布

(1)方差齐性检验:

Ho:三总体方差齐即2

3

2

2

2

1



H

1

:三总体方差不等或不全相等。

α=0.05

)/()1(22kNnss

iic

9(4.4+2.933+5.733)/(30-3)=4.3553

=0.9461

v=2,查附表9,X2界值表,得0.75>P>0.50,按α=0.05水准,不拒绝

Ho,故可认为三组资料总体方差齐。

(2)三组均数比较(表4-5)

Ho:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。

H

1

:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全

相等

α=0.05

C=(∑∑Χ

ij

)2/n=2882/30=2764.8

SS

=∑∑Χ

ij

2-C=2924-2764.8=159.2

SS

组间

=∑(∑Χ

ij

)2/ni-C

=[922+842+1122]/10-2764.8

=41.6

SS

组内

=SS

-SS

组间

=159.2-41.6=117.6

表4-5方差分析表

变异来源SSvMSF

总变异159.229

组间变异41.6220.84.776

组内变异117.6274.3556

查附表4,得0.05>P>0.01,在α=0.05水准上,拒绝Ho,接受H

1

,故

可以认为大白鼠感染脊髓灰质炎病毒后,在接种伤寒或百日咳菌苗对生存

日数有影响。

(3)均数间多重比较:

Ho:任一组与对照组总体均数相同

H

1

:任一组与对照组总体均数不同

α=0.05

伤寒与对照组比较

=(11.2-9.2)/)10/110/1(3556.4

=2/0.933338

=2.1428

v=27,得0.05>P>0.02,按α=0.05水准,拒绝Ho,接受H

1

,故可认为接

种伤寒菌苗组较对照组生存日数减少。

百日咳与对照组比较

v=27,查附表2,得0.01>P>0.005,按α=0.05水准,拒绝Ho,接受H

1

可以认为接种百日咳菌苗组较对照组生存日数减少。

3.研究酵解作用对血糖浓度的影响,从8名健康人中抽取血液并制备了血滤液,没一

个受试者的血滤液又分成4份,再随机地把4份血滤液分别放置0,45,90,135分钟,

然后测定其中血糖浓度(mmol/L)

(1)4组血滤液方差齐性检验:

Ho:不同放置时间血滤液所含血糖浓度总体方差相等,

即2

4

2

3

2

2

2

1



H

1

:不同放置时间血滤液所含血糖浓度总体方差不等或不全相等

α=0.05

方差齐性检验方法同本例X2=1.16847

v=k-1=4-1=3,查附表9,X2界值表,得0.90>P>0.75,按α=0.05水

准,不拒绝Ho,可以认为放置不同时间血滤液所含血糖浓度总体方差齐。

表4-3放置不同时间血滤液所含血糖浓度(mmol/L)

受试者编号放置时间受试者小计

04590135

15.275.274.494.6119.64

25.275.224.884.6620.03

35.885.835.385.0022.09

45.445.385.275.0021.09

55.665.445.384.8821.36

66.226.225.615.2223.27

75.835.725.384.8821.81

85.275.115.004.4419.82

ΣΧ

ij

44.8444.1941.3938.69169.11

n

i

88888

i

X5.60505.52385.17384.83635.2847

∑2

ij

X252.1996245.0671215.0527187.5585899.8779

2

i

s0.12450.13890.13020.06340.1143

(2)配伍组设计方差分析:

处理:Ho:不同放置时间血滤液所含血糖浓度相同

H

1

:不同放置时间血滤液所含血糖浓度不同或不全相同相同

α=0.05

配伍:Ho:8位受试者血液所含血糖浓度相同

H

1

:8位受试者血液所含血糖浓度不同或不全相同

α=0.05

С=(ΣΣⅩ

ij

)2/n=169.112/32=893.6935

SS

=ΣΣⅩ

ij

2-С=899.8779-893.6935=6.1844

SS

放置时间

=

CX

bij

2)(

1

=(44.842+44.192+41.392+38.692)/8-893.6935

=2.98524

SS

受试者

=CXk

ij

2)(/1

=1/4(19.642+20.032+22.092+21.092+21.362+23.272

+21.812+19.82)-893.6935

=2.79093

SS

误差

=SS

-SS

放置时间

-SS

受试者

=6.1844-2.98524-2.79093=0.40832

方差分析表

变异来源SSvMSF

总变异6.184431

放置时间2.9852430.9950851.189

受试者2.7909370.3987020.510

误差0.40823210.01944

查F界值表F0.05(3,21)=3.07F0.01(3,21)=4.87

F0.05(7,21)=2.49F0.01(7,21)=3.64

放置时间受试者间均P<0.01,按α=0.05水准,均拒绝Ho,接受H

1

,故

可认为不同放置时间、不同受试者间血滤液所含血糖浓度不同或不全相

同。

(3)不同放置时间血滤液所含血糖浓度均数间多重比较,采用多个实验组

与一个对照组均数间两两比较。

①Ho:放置45分钟与0分钟血滤液所含血糖浓度相同

H

1

:放置45分钟与0分钟血滤液所含血糖浓度不同

α=0.05

=0.0812/0.06971=1.16476

v=n-k=32-4=28,查附表2,t界值表,得0.40>P>0.20,按α=0.05

水准,不拒绝Ho,尚不能认为放置45分钟与0分钟血滤液血糖浓度总均

数有差别。

②Ho:放置90分钟与0分钟血滤液所含血糖浓度相同

H

1

:放置90分钟与0分钟血滤液所含血糖浓度不同

α=0.05

=0.4312/0.0697=6.1853

v=28,查附表2,t界值表,得P<0.001,按α=0.05水准,拒绝Ho,

接受H

1

,可认为放置90分钟较0分钟血滤液所含血糖浓度减少。

③Ho:放置135分钟与0分钟血滤液所含血糖浓度相同

H

1

:放置135分钟与0分钟血滤液所含血糖浓度不同

α=0.05

=0.7687/0.0697

=11.0265

v=28,查附表2,t界值表,得P<0.001,按α=0.05水准,拒绝Ho,

接受H

1

,故可认为放置135分钟较0分钟血滤液所含血糖浓度减少。

4.某医师为研究人体肾上腺皮质HSD3(羟基类固醇脱氢酶)活性在四个季节中是

否有差别,采用分光光度计随机测定了部分研究对象,数据见表2.8,请做统计分析.

表4-4四个季节的人体肾上腺皮质HSD3活性

季节nXS

春季420.780.13

夏季400.690.22

秋季320.680.14

冬季360.580.20

解:本题仅给出分析思路及主要结果

1.采用完全随机设计资料的方差分析:

(1)由公式

n

X

X

可推得XnX

由方差公式可推得

)1(

)(

2

2

2

ns

n

X

X

(2)计算SS

SS

组间

SS

组内

SS

=5.365,SS

组间

=0.777SS

组内

=4.588

列出方差分析表

方差分析表

变异来源SSvMSF

总变异5.365149

组间变异0.77730.25908.248

组内变异4.5881460.0314

(4)确定P值,判断结果

查方差分析表,得P<0.01,在

=0.05水准上,拒绝Ho,接受H

1

,可以认为四个

季节人体肾上腺皮质

HSD3

(羟基类固醇脱氢酶)活性不同或不全相同.

2.进一步作均数间的多重比较分析(略)

第五章相对数

答案

填空题

1.比重和分布,频率与强度

2.率

3.消除混杂因素对结果影响

4.率,构成比,相对比

5.率的抽样误差δx

是非题:

1.√2.×3.√4.×5.√6×.7.×8.×9.×10.×

11.×

单选题:

1.D2.E3.A4.D5.A6.B7.D8.A9.D10.D

11.B12.E13.A14.C15.E16E.17.E18.B19.A20.A

21.C22.D

计算题:

1.表5-1(1)~(4)栏资料宜计算那些相对数指标?试对围产儿在围产期死亡的主

要因素作初步分析。

表5-1不同体重,孕周,产次的围产儿死亡情况分析

因素分组出生数死亡数死亡构成比(%)死亡率(%)

(1)(2)(3)(4)(5)(6)

体重(g)1000~1.18119.91

2500~6.835.84

4000~5373481.998.93

合计2.0011.54

孕周(周)<38.55113.32

38~3.469.32

42~140132445.9917.41

合计2221284075100.0018.35

产次(次)62.8014.55

25159673923.9214.32

372562598.3835.69

41786822.6545.91

≥5954692.2372.33

合计00.0015.85

先就上述资料计算了上表(5)~(6)栏两类指标。

由表中死亡率可知;体重低于2500g组围产儿死亡率约为2500g组的20倍;孕

周<38周组围产儿死亡率约为38周组的12倍;随着产妇的产次增加,围产儿死

亡率也逐渐升高。

由表中死亡构成比可知:半数以上的围产儿死亡率集中在体重1000~2500g组和

孕周<38周组。为降低围产儿死亡率,对体重偏低,不足月妊儿及多产次产妇应

加强产前保护。

2.表5-2为一抽样研究资料

(1)填补空白数据,见下表()内。

表5-2某地各年龄组恶性肿瘤死亡情况

年龄人口数死亡总数其中恶性恶性肿瘤死亡恶性肿瘤死年龄别死

(岁)肿瘤死亡数占总死亡的(%)亡率(1/10万)亡率(%0)

(1)(2)(3)(4)(5)=(4)/(3)6)=(4)/(2)(7)

0~82920(138)42.90(4.82)(1.644)

20~(46638)63(12)19.0525.73(1.351)

40~2816117242(24.42)(149.142)(6.108)

60~(9371)(342)32(9.63)(341.479)(36.496)

合计167.59(53.863)(4.279)

(2)根据最后(5)(6)(7)三栏结果作简要分析

由表中第(5)栏可知:40~岁组恶性肿瘤死亡占总死亡比重最高,近1/4;20~

岁组次之,占19.5%;60~岁组恶性肿瘤死亡人数最多,但仅占9.36%;0~岁组恶性

肿瘤死亡占总死亡比重最底,仅占2.90%由表中第(6)栏可知:恶性肿瘤的年龄别死

亡随年龄的增大而增加,以60~岁组为最高,为341.479/10万。故可认为恶性肿瘤对

老年人危害最大,应引起足够的重视。由表中第(7)栏可知:年龄别死亡率以40岁

以下最低,以后随年龄的增加而增加,60岁以后高达36.496‰。

(3)试估计“0~”岁年龄组恶性肿瘤死亡率和年龄别死亡率的可信区间。

0~岁组恶性肿瘤死亡率的可信区间:死亡数为4,查poisson分布u的可信区间,

可信区间为1.0~10.2。所以恶性肿瘤死亡率的95%可信区间为:

(1.0/82920~10.2/82920)=(1.206~12.301)/10万

0~岁组年龄别死亡率的可信区间,按式:

(4)试比较“20~”与“40~”岁组恶性肿瘤死亡率有无差别。

Ho:20~与40~岁组恶性肿瘤死亡率相等,即π

1

2

H

1

:20~与40~岁组恶性肿瘤死亡率不相等,即π

1

≠π

2

α=0.05

本例:n

1

=28161x

1

=42n

1

-x

1

=28119

n

2

=46638x

2

=12n

2

-x

2

=46626

合计:747995474745

X2=37.07

查X2界值表,得P<0.005在α=0.05的水准上,拒绝Ho,接受H

1

,故可认为20~岁

组与40~岁组恶性肿瘤死亡率有差别。

3.试就表5-3资料分析比较甲乙两医院乳腺癌病人手术后的五年生存率。

表5-3甲乙两医院乳腺癌病人手术后五年生存率

标化(甲+乙医院合计为标准)

腋下淋巴标准病甲医院乙医院

结转移例数原生存率(%)预期生存人数原生存率(%)预期生存人数

NiPiNiPiPiNiPi

(1)(2)(3)(4)=(2)(3)(5)(6)=(2)(5)

无34577.77268.3171.67247.26

有79363.38502.6050.60401.26

合计1138(∑Ni)64.24770.91(∑NiPi)67.10648.52

甲医院乳腺癌手术后五年标化生存率

N

N

ii



'×100%=

1138

91.770

×100%=67.74%

乙医院乳腺癌手术后五年标化生存率

N

N

ii



'×100%=

1138

52.648

×100%=56.99%

因为甲乙两医院有无腋下淋巴结转移的病型构成不同,故标化后,甲医院乳腺癌

手术后五年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。

2.为了解某乡钩虫感染情况,随机抽查男200人,感染40人,女150人,感染20人。

(1)该乡男性感染率是否高于女性?

Ho:男女性的钩虫感染率相同,即π

H

1

:男性的钩虫感染率高于女性,即π

>π

单侧α=0.05

P

1

=40/200=0.2P

2

=20/150=0.1333

P

C

=(X

1

+X

2

)/(n

1

+n

2

)=60/350=0.1714

u=

)n/1n/1)(P1(P

PP

21CC

21



=

6385.1

)150/1200/1)(1714.01(1714.0(

1333.02.0



查t界值表,υ=∞,得单侧0.10>P>0.05,按α=0.05水准,不拒绝Ho,尚不

能认为该乡男性钩虫感染率高于女性。

(2)若对该乡居民作驱钩虫治疗,需要按多少人准备药物(全乡人口男7253人,女

7109人)?

计算该乡钩虫感染率的95%可信区间:

=(13.19~21.09)%

14362×13.19%=1894(人)14362×21.09%=3029(人)至少需要按1894人,

最多按3029人准备药物。

3.抽样调查某企业2839名职工高血压病,结果见表.据此,某医生认为:①该企业高血

压发病率为8%,并随年龄递增,其中40岁以上患者占全部病例的90.3%,60岁以

上者发病率为100%。②高血压发病与性别有关,男性为10.2%,女性为4.5%,男

性明显高于女性(P<0.01)。以上分析是否妥当,试加评述。

表5-4男、女年龄组高血压病例分布

男性女性

年龄组——————————————————————————————

受检人数病例数发病率(%)受检人数病例数发病率(%)

20~33351.571240.6

30~30141.314296.3

40~5176412.41852714.6

50~5769316.061914.8

60~1212100.0

合计173917810.21100494.5

答:该分析不正确。因为:

(1)高血压患病率为8%,而不是发病率。原文中60岁以上的发病率是100%,应

为患病率,且由于60岁以上受检人数太少,不宜计算相对数。

(2)由于男女性受检人数的年龄构成不同,不能直接比较两总患病率,对男女合

计进行假设检验更无意义。由于各年龄组患病率出现明显交叉,如:20~和

50~岁组的男性患病率均高于女性,而30~和40~岁组的男性患病率均低

于女性。此资料宜直接比较各年龄组的患病率,而不宜使用标准化。

4.某产院拟分析畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,畸形儿116

例,得以下资料。据此得出结论:“母亲年龄在24~29岁时,畸形儿最多,占总数

的92.2%,符合一般规律”。

母亲年龄(岁)2282930313233合计

畸形儿例数9133111116

%0.861.712.116.420.715.516.411.22.60.860.860.86100.00

(1)以上结论是否合理?为什么?以上结论不合理,不能以比代率。

(2)若要达到作者之目的,应计算什么相对数指标较好?如何计算?

若要达到作者的目的,应计算产妇年龄别畸形儿发生率。

某年龄(组)畸形儿发生率=

%100

死胎数死产该年龄组活产

胎婴儿数某年龄组先天性畸形的

7.某市1971~1981年乙型脑炎发病率如表5-5,试作动态分析

表5-5某市1971~1981年乙型脑炎发病率动态分析

年份发病率绝对增长量发展速度(%)增长速度(%)

(1/10万)累计逐年定基比环比定基比环比

197120.52——100100——

19726.31-14.21-14.2130.7530.75-69.25-69.25

19731.87-18.56-4.449.1129.64-90.89-70.36

19743.07-17.451.2014.96164.17-85.0464.17

19751.08-19.44-1.995.2635.18-94.74-64.82

19761.38-19.140.306.73127.78-93.2727.78

19772.29-18.230.9111.16165.94-88.8465.94

19782.31-18.210.0211.26100.87-88.740.87

19792.47-18.050.1612.04106.93-87.966.93

19802.76-17.760.2913.45111.74-86.5511.74

19812.94-17.580.1814.33106.52-85.676.52

本资料从1971年到1974年,发病率呈下降趋势,1975年开始呈上升趋势,

故以1975年为基期计算。

平均发展速度=%2.11808.1/94.26

平均增长速度=平均发展速度-1=1.182-1=18.2%

动态分析:从绝对增长量看,各年乙型脑炎发病率均低于1971年,10年内

共降低17.58/10万。总的来看发病率呈下降趋势,但降低的速度是不平衡的;

从发展速度和增长速度来看,在最初的1971~1975年是基本下降的,以后又略

有回升现象。在1975年至1981年期间发病率平均发展速度为118.2%,平均增长

速度为18.2%。

8.从表5-6资料,判断某工厂肺癌发生率是否比一般人群高?

表5-6某工厂肺癌发生率

分组某厂一般人群

人数肺癌人数肺癌发生率(1/万)

吸烟70054.5

不吸烟30011.5

Ho:μ=μo

H

1

:μ>μo

单侧α=0.05

μo吸烟=n

1

π

1

=700×0.00045=0.315

μo不吸烟=n

2

π

2

=300×0.00015=0.045

吸烟者的肺癌发生人数X≥5累计概率:

P=1-[p(0)+p(1)+p(2)+p(3)+p(4)]

P(0)=e-μ=e-0.315=0.7298

P(1)=P(0+1)=P(0)×μ/(0+1)=0.7298×0.315/1=0.2299

P(2)=P(1+1)=P(1)×μ/(1+1)=0.2299×0.315/2=0.0362

P(3)=P(2+1)=P(2)×μ/(2+1)=0.0362×0.315/3=0.0038

P(4)=P(3+1)=P(3)×μ/(3+1)=0.7298×0.315/4=0.000299

P=1-(0.7298+0.2299+0.0362+0.0038+0.000299)=0.000001,按α=0.05水准

拒绝Ho,接受H

1

,故可认为某工厂吸烟的肺癌发生率明显高于一般人群

不吸烟组:Ho:μ=μo

H

1

:μ>μo

单侧α=0.05

不吸烟者的肺癌发生人数X≥1的累计概率:

P=1-P(0)

P(0)=e=e-0.045=0.956

P=1—0.956=0.044,按α=0.05水准拒绝Ho,接受H

1

,故可认为某工厂不吸烟的

肺癌发生率高于一般人群。

9.就表5-7资料如何比较甲乙两厂某工种某病患病率

表5-7甲,乙两厂某工种某病患病率

工龄甲厂乙厂

(岁)工人数患者患病率(%)工人数患者患病率(%)

<3400123.0010011.00

≥31001010.004007218.00

合计500224.405007314.60

从表中可以清楚看到≥3的工龄组的患病率乙厂高于甲厂,<3岁组甲厂高于乙厂,

呈现交叉现象。甲厂以患病率低的3年以下工人为主,乙厂则以患病率高的工龄

在3年以上的工人为主。这种情况下不能直接比较总患病率,应按不同工龄组进

行比较

10.设某病患者的自然康复率为30%,分别求10个患者中自然康复1人及以下,8人以

上的概率

本例π=0.30,1-π=0.7,n=10。依题意10名患者中:

(1)康复1人及以下的概率

P(X≤1)=)1()0()(

1

0

PPXP

P(0)=0.710=0.02825

P(1)=12106.03.07.0

)!110(!1

10

)110(

P(x≤1)=0.02825+0.12106=0.1493

(2)康复8人及以上的概率。

P(x≥8)=)10(10)9()8()(

10

8

ppXp

P(8)=xxn

n

xX)()1)((

=0014467.03.07.0

)!810(!8

!10

8)810(

P(x+1)=P(X)×

11X

Kn

P(9)=p(8)

0001378.0

3.01

3.0

18

810

P(10)=0.310=0.000005905

则P(x≥8)=P(8)+P(9)+P(10)=0.00159

当某病自然康复率为30%时,10名患者中1人及1人以下康复的概率为0.14931,

康复8人及8人以上的概率为0.00159

11.用某型麻疹疫苗接种一批麻疹易感儿,把接种后已阳转者96名作为观察对象,3

年后复查,96名中仍为阳性者为85名,试求该疫苗接种阳转者3年后仍保持阳性

的百分率的95%可信区间

因为nP=85,nq=11,均大于5,n=96>50,可按正态近似求该疫苗接种3年仍

保持阳转率的95%可信区间。

=0.85540.0637=(82.17~94.91)%

12.用一种新药治疗某种寄生虫病,受试者50人中在服药后1人发生严重反应,这种

反应在此病患者中也曾有发生,但过去普查结果为每5000人仅有一人出现。问

此药是否提高了这种反应生率?

Ho:服药后的反应率与普查时的反应率相等,即受试者每50人服药后平均反应人

数为μo

H

1

:服药后的反应率高于普查时的反应率,即μ>μo

单侧α=0.05

本例n=50,πo=1/5000=0.0002,μo=nπo=50×0.0002=0.01,样本例数为50时,

抽得样本严重反应人数X≥1的概率:

P=1-P(0)P(0)=99.001.0ee

P=1-0.99=0.01

今P=0.01,按α=0.05,拒绝Ho,接受H

1

,故可认为此新药能提高了这种反应的

发生率。

13.同一水样中,每次抽取1ml置培养皿中,共作10个平板培养,共数得菌落146个,

试估计该检样菌落数的95%可信区间。

X=146(个),X>50,用正态近似法求该检样本菌落数的95%的可信区间为:

X±)(68.169~32.12214696.1146Xu

a

个

14.某疫苗预防接种后,进行有关的非传染性疾病流行病学考核,结果如下:接种组

与对照组各调查10万人,接种组发病22人,对照组发病36人。试问两组发病

率有无差别?

Ho:两组发病率相同,即μ

1

2

H

1

:两组发病率不相同,即μ

1

≠μ

2

α=0.05

本例人36

1



2

=22人

u=

8383.1

3622

2236

21

21





查附表2,t界值表,υ=∞,得0.1>P>0.05,在α=0.05的水准上,不拒绝

Ho,尚不能认为两组发病率有差别。

15.甲乙两市分别用抽样调查了解已婚妇女宫颈癌的患病情况,甲市调查1万人,患者

82例,乙市调查2万人,患者102例。问甲乙两市宫颈癌患病率有无差别?

Ho:两市已婚妇女宫颈癌患病率相等,即μ

1

2

H

1

:两市已婚妇女宫颈癌患病率不相等,即μ

1

≠μ

2

α=0.05

1

X=82/10000=0.0082,

2

X=102/20000=0.0051

u=

20000/0051.010000/0082.0

0051.00082.0

//

2211

21

nXnX

XX

=2.9899

本题也可以万人为单位,计算更为简单:

u=9899.2

2/5182

5182

查附表2,t界值表,υ=∞,得0.005>P>0.002,在α=0.05的水准上,拒绝Ho,

接受H

1

,故可认为两市妇女子宫颈癌患病率的差别有显着性,甲市已婚妇女子宫

颈癌患病率高于乙市。

16.观察某种防治细菌性痢疾(菌痢)措施的效果,结果如表3-6。问能否据此认为该

措施有效?

表5-8两组人群菌痢发病率的比较(1979年)

分组人数菌痢例数(无菌痢数)发病率(‰)

试验组41182140975.1

对照组521772514513.8

合计93359392429.96

Ho:π

1

2

H

1

:π

1

≠π

2

单侧α=0.05

u=

)/1/1)(1(

21

21

nnPP

PP

CC



=

204.4

)5217/14118/1)(00996.01(00996.0

0138.00051.0





查附表2,t界值表,υ=∞,得P<0.005,按α=0.05的水准,拒绝Ho,接受H

1

故可认为实验组和对照组的菌痢发病率有差别,实验组的发病率低于对照组,即该

措施有效。

17.把某肿瘤新发病例按住址点在一张地图上,又将地图划分成许多面积相等的小方

格,再分别统计发病数0,1,2,……及相应的方格数,对此资料作Possion分布

拟合优度的X2检验,若P<0.05,就可认为此病在人群中的分布不随机,可能有

聚集性。你认为如何?

答:对此资料作Poisson分布拟合优度的X2检验,若P<0.05按α=0.05水准,

拒绝Ho,接受H

1

,可认为此资料不服从Poisson分布,也即可以认为此病在人群

中不呈随机分布,再综合考虑环境(地形、地貌)遗传等资料,结合专业知识确

定有无聚集性。

18.某乡有人口5000人,已知血吸虫粪检阳性率下降至5%左右。血防站准备进行一次

血吸虫感染的普查,拟先将每10人粪便作为一个初筛的混合样本,混合样本血吸

虫卵阴性,则该10人均作阴性;混合样本阳性,再对该混合样本的10人粪便逐

人复查。问此法比一般的逐人粪便检查会减少多大的工作量?

设:k=每组混合样本例数;P=粪检血吸虫卵阳性率;q=阴性率=1-p;

N=全部受检人数;N/k=混合样本数,即组数

(1)计算每组平均检验次数。

由二项分布理论可知:

概率检验次数

混合样本内粪检q.q.q…q=qk1

全部为阴性

混合样本内粪检1-qkk+1

至少有1例阳性

一组平均检验次数=(qk×1)+(1-qk)(k+1)=k-kqk+1(1)

(2)计算全部检验期望数。

全部检验期望数=(N/k)(k-kqk+1)=N(1-qk+1/k)(2)

本例已知:N=5000,K=10,P=0.05,q=1-p=0.95,代入试(2)

全部受检期望数=5000×(1-0.9510+1/10)=2506.32

比一般逐人检查减少工作量:5000-2506.32=2493.68,减少工作量的百分比为:

2493.68/5000=49.87%。

19.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,

将全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果

如表5-9,试估计该县百白破疫苗接种率的95%可信区间。

表5-9某县三类乡百白破疫苗接种率调查结果

类别人数抽样人数接种率

好73717230.8174

较好1489914780.6969

差93089300.3022

合计305783131

本题为求按比例分配的分层抽样中总体率的可信区间,首先计算接种率及

其标准误。

(1)p=[ΣΝ

i

Ρ

i

]/Ν=1/31578[7371×0.8174+14899×06969+9308×0.3022]

=19221.0461/31578=0.608685

(2)NnppNnNs

iiiiip

/)1/()1()[(/1(2

=)}1930/(6978.03022.0)[9308/9301(

2

9308)]1723/(1826.08174.0)[7371/7231(

2

7371

=0.007520

该率不接近于0或1,一般认为服从二项分布。因n=3131,较大,可用

正态近似法计算其可信区间。

95%CI:P±1.96sp=0.608635+1.96×0.007520=(0.5939,0.6234)

20.为了解某县某病感染率,现从全县125个村民组(共3万人)中随机抽出10个村

民组,对该10个村民组的全部人口进行了调查,结果如下,试据此估计此县农村

居民感染率

村民组合计

人数493503702386

感染人数497

本例采用整群抽样作总体率的点估计和区间估计。

按正态近似原理计算:已知:K=125,k=10

点估计:p=(K/Nk)(Σα

i

=(125/30000/10)×(797)=0.3321

=0.03355

95%?可信区间:P±1.96sp=(0.2663,0.3979)

99%可信区间:P±2.58sp=(0.2455,0.4187)

第六章χ2检验

1.合理并组

2.确切概率法(精确X2.0)

3.n≥401≤T<5

是非题:

1.√2.√3.×4.×5.×6.√7.√

单选题:

1.A2.A3.B4.D5.A6.E7.C8.E9.A10.B

11.D12.D13.B14.A15.E16.C17.D18.C19.A20.A

21.E

问答题:

1.X2检验适用于解决那些问题?对资料的设计类型和应用条件有何不同要求?

(1)X2检验适用于:①两个及两个以上的率或构成比的比较;②计数资料

两因素间的相关关系;③频数分布的拟合优度检验。

(2)对资料的设计类型和应用条件。

1)四格表的X2检验:

基本公式

T

TA

X

2

2

)(

T>5且n>40

专用公式

))()()((

)(2

2

dbcadcba

nbcad

X



校正公式

))()()((

)2/(2

2

dbcadcba

nnbcad

X





1<T<5且n>40

T

TA

X

2

2

)5.0(

当T<1或n<40时,可使用确切概率计算法直接计算概率,应用时注意区分单、

双侧检验。双侧检验。双侧检验取两侧累积概率,单侧检验只取一侧累积概率。

2)行×列(R×C)表资料的X2检验:

基本公式与四格表基本公式相同。

专用公式:

)1(

2

2

CR

nn

A

nX

可使用实际频数计算X2。

适用条件①行×列表不宜有1/5以上的格子的理论频数小于5,或有一格理

论频数小于1。②当多个样本率(或构成比)比较的X2检验,拒绝检验假设,

只能认为各总体率(或构成比)之间总的有差别,但不能说明彼此间都有差别

或某两者间有差别,若要进一步解决此问题,可用X2分割法。③对单向有序

联表,X2检验只说明各处理组的效应在构成比上有无差别。

3)列联表资料的X2检验:

R×C列联表公式:与R×C(行×列)表相同,但检验假设不同,R×C

列联表用于检验有无关联,而R×C(行×列)表用于多个率或构成比的比较。

适用条件与行×列表适用条件①相同。

2×2列联表或配对资料X2检验,检验两个处理有无差别。

cb

cb

X

2

2

)(

b+c>40

或校正公式

cb

cb

X



2

2

)1(

b+c<40

检验两种处理间有无相关,公式同四格表所用公式

4)频数分布拟合优度的X2公式

T

TA

X

2

2

)(

适用条件遇有理论频数小于5时,可与相邻组合并。

2.X2检验的基本思想是什么?

X2检验的基本思想是实际数与理论编数的吻合程度,它是根据检验假设来确定的,

如作两样本率的比较,我们先假设两组的总体率相同,均等于两组合计的总率,如

果检验假设成立,则实际数与理论数之差一般不会很大。出现很大的X2值的概率是

很小的若PX则没有理由

拒绝它

3、四表格资料在何种情况下需要进行校正?为什么?

在1≤T<5n≥40时,需要计算校正X2

推断统计量X2时是用一种连续概率分布(X2分布)作为对观测频数概率分布的近似,

为改善此近似提出了一个修正,即取平方之前将正偏差(A-T)减0.5,负

偏差加0.5,这样使X2值降低,校正后的概率更接近确切的概率。

4、行X列表X2检验的注意事项有哪些?

(1)X2检验要求理论数不宜太小,否则将导致分析的偏性,一般认为行X列表中不宜

有1/5以上格子的理论频数小于5,或有一个理论数小于1。

对理论数频数大小有三种处理方法:

①最好增加样本例数以增加理论频数

②删去上述理论频数太小的行或列

③将太小理论频数所在行或列与性质相近的邻行邻列的实际频数合并。

后两法可能会损失信息,也会损失样本的随机性,不同的合并方式有可能影响推断

结论,故不宜作常规方法。

(2)当多个样本率(或构成比)比较的X2检验,结论为拒绝检验假设,只能认为各总

体率(或总体构成比)之间总的来说有差别,但不能说明它们彼此见都有差别,或

某两个间有差别,实际工作中,常常还需要知道各组间比较的情况,若要进一步解

决此问题,不能采用一般四格表的X2检验进行两两比较,因为这会增大犯Ⅰ型错误

的概率,可采用以下方法:

①改变显着水准后的两两比较法(Brunden法)

前已述及,若将多个样本两两构成四格表,用一般的四格表方法会增大Ⅰ型错误,

那么,一种自然的想法就是能否将显着水准适当降低,从而一方面相当于抵消Ⅰ型

误差的增加,一方面又可采用一般的四格表方法处理?改变显着性水准的方法正是

基于这种思想。Brunden法系将检验水准α调整为α

α’=α/2(K-1)(9.10)

式中K为样本数,然后用求得的各四格表的X2值与X2α值比较,从而作出推断,也

就是说,若取α=0.05,K=6(则α’=0.005),则不能用X2

0.05(1)

=3.84为界值,而要

用X2

0.05(1)

=7.88为界值。此外,也可用各四X2检验对应的P值与α’比较而得出结

论。

②改变显着界值的两两比较法:

该法类似于上法,但考虑到了处理组数a,因而更合理,处理组数a是各组按率的

大小排列后,欲比较的两组间包括的组数,表9.1列出了用蒙特卡洛模拟法求出K×2

表分割为非独立的四格表的显着界值。有了此显着界值后,只要用各四格表的X2值

与相应的界值相比即可作出结论。

K×2表分割为非独立的四格表的显着界值

K处理a

23456

33.105.48

5.158.48

43.004.486.48

4.786.539.33

53.053.995.237.23

4.405.707.359.88

63.033.944.706.158.05

4.505.406.558.4510.00

计算题:

1.某医师用甲、乙两药治疗某病,结果如下表,问甲、乙两药疗效有无差别?

表6-7甲、乙两药疗效比较计算表

药物治愈数未治愈数合计

甲291140

乙69473

合计9815113

Ho:两药疗效相同,即π

1

2

H

1

:π

1

≠π

2

α=0.05

T

min

=15×40/113=5.31且n>40用公式

))()()((

)(2

2dbcadcba

nbcad

X



=10.88

查X2界值表,得P<0.01,按α=0.05的水准拒绝Ho,接受H

1

,故可认为甲、乙

两药疗效有差别,乙药疗效较好。

2.某卫生防疫站在中小学观察三种矫治近视眼措施的效果,近期疗效数据如表,结论

为“近期疗效要以夏天无眼药水最好,保健操为次,新医疗法最差”。试对此作分

析评价。

表6-2三措施的近期有效率比较

矫治方法有效人数无效人数(合计)有效率(%)

夏天无眼药水518413537.78

新医疗法6263218.75

眼保健操5131827.78

合计6212318533.51

Ho:三组药物近期有效率相等

H

1

:三组药物近期有效率不等或不全相等

α=0.05

+498.4)1

12318

13

6218

522



v=(2-1)(3-1)=2查X2界值表,得0.25>P>0.1,按α=0.05的水准不拒绝Ho,

尚不能认为三种措施的近期有效率有差别。

3.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料整理如表。问两者之

间是否存在一定的关系?

表6-3某厂职工冠心病与眼底动脉硬化普查结果分析

眼底动脉硬化冠心病诊断结果合计

正常可疑冠心病

Ⅰ7313692

Ⅱ+Ⅲ1002019139

合计5134431588

注:原表中

3,4

T=6×31/588=0.3163<1,故将Ⅱ和Ⅲ级合并

(1)解法Ⅰ:本题为双向有序分类变量,可设X为眼底动脉硬化等级,Y为冠心病诊

断结果,X、Y的等级分别为1、2、3。计算Spearman等级相关系数r

s

=0.2988,

P<0.05,眼底动脉硬化程度与冠心病诊断结果存在正相关。

(2)解法Ⅱ:列联表X2检验

Ho:冠心病与眼底动脉硬化级别无关

H

1

:冠心病与眼底动脉硬化级别有关

α=0.05

31139

19

44139

20

513139

100

3192

6

4492

13

51392

73222222

-1=58.134

查附表9,X2界值表,得P<0.005,按α=0.05的水准拒绝Ho,接受H

1

,故可认

为该厂职工冠心病与眼底动脉硬化级别有关。

4.表6-4用两种方法检查已确诊的乳腺癌患者120名。甲法检出率为60%,乙法检出

率50%,甲乙两法一致的检出率为35%,问:

(1)两种方法何者为优?

表6-4甲乙两法检验结果

乙法甲法合计

+-

+421860

-303060

合计7248120

Ho:两法分不出优劣,即B=C

H

1

:两法能分出优劣,即B≠C

α=0.05

b+c=18+30=48>40

v=1,查附表9,X2界值表,得0.10>P>0.05,按α=0.05的水准不拒绝Ho,尚

不能认为检出率有差别

(2)两种方法的检出结果是否有关系

Ho:两法的检出结果无关系

H

1

:两法的检出结果有关系

α=0.05

24120/4860

min2,1

Tn>40用公式

=

00.5

48726060

120)30183042(2





查X2界值表,得0.05>P>0.01,按α=0.05的水准拒绝Ho,接受H

1

,故可认为

甲、乙两法检出结果有关。

4.经反复多次实践证明,用一般疗法治疗某病的治愈率约为20%。现改用新疗法治疗,

并随机抽取400名该病患者进行治疗,那么这400名患者中至少要多少人治愈才能

判断比一般疗法效果好?此判断发生错误的概率有多大?

Ho:两种疗效法治愈率相同,即

2.0

H

1

:2.0

单侧α=0.05

本例n=4002.0

u=

n

p

/)1(

00

0



解之,nup/)1(

000



=0.2+1.645400/)2.01(2.0=0.2329

X=Np=4000.2329=94(人)

400名患者中至少要有94人治愈才能判断新疗法比一般疗法效果好。此判断可能

发生错误的概率为5%

5.某种化学物质经诱发肿瘤试验,实验组15只白鼠中4只发生癌变,对照组10只白

鼠无一发生癌变(表6-5)。问两组发癌率有无差别?

表6-5某药物肿瘤治疗试验

发癌数未发癌数合计

实验组41115

对照组0(1.6)1010

合计42125

Ho:两组发癌率相等,即π

1

2

H

1

:两组发癌率不等,即π

1

≠π

2

α=0.05

本题n=25<40,故用四格表的确切概率法公式:

P=

!!!!!

)!()!()!()!(

ndcba

dbcadcba

周边合计保持不变的四格表有(1)~(5):

取︳A-T︳大于等于1.6表的概率和,即P=p(1)+p(5)=0.1076+0.0166=0.1242,

按α=0.05水准不拒绝Ho,尚不能认为两组的发癌率有差别。

6.某医院收治了100例临床确诊的小儿佝偻病患者,入院时均分别作血生化检查与X

光片检查(表6-6)。欲了解此病法何者较敏感,试设计一整理表,并指出宜作何

统计处理?

应做配对设计表6-6佝偻病患儿入院检查登记表

编号生化检验X光片

1

2

.

.

100

每个患儿按检查顺序编号,生化指标及X光片阳性记为“+”,阴性记为“-”,根

据表6-6登记结果,整理归纳记入表6-9。

表6-9生化检查和X线检查结果

生化X线检查合计

检查+-

+αbα+b

-cdc+d

合计a+cb+dN

若在考虑了两法一致的a,d以后,仍拟比较两法何者较敏感,应做配对资料的X2检验.

)(

)(2

2

cb

cb

X

(b+c>40)

)(

)1(2

2

cb

cb

X



(b+c<40)v=1

8.某医生观察某新药对预防流行性感冒(流感)的效果,并作了统计处理(表3-18),你

对此有何意见

表6-7用药组和对照组流感患病率比较

发病数未发病数合计有效率%

服药组5013018072.2

未服药组4019023082.6

合计9032041078.05

X2=6.63,P<0.05

(1)因旨在观察新药的效果,根据服药组有效率低于对照组(未服药)就不必进行

假设检验。

(2)应对本项实验观察的易感者暴露条件进行分析是否均衡可比。

第七章秩和检验

答案

填空题

1.非参数统计(秩和检验)

2.不受总体分布的限定,适应范围广,检验效率低于参数检验

3.P<0.054.n>25

是非题:

1.√2.√3.×4.√

单选题:

1.A2.D3.C4.D5.B6.B7.E8.E9.A10.D

11.C12.B

问答题:

1.参数检验与非参数检验的区别何在?各有何优缺点?

(1)参数检验与非参数检验的区别。

1)参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。

2)非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。

(2)参数检验与非参数检验的优缺点。

1)参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等

级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布型已知

和总体方差相等。

2)非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条

件的资料用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非

参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,

如需检验出同样大小的差异的差异往往需要较多的资料。另一点是非参数检验

统计量是近似服从某一部分,检验的界值表也是有近似的(如配对秩和检验)

因此其结果有一定近似性。

2.非参数检验适用那些情况?

(1)等级顺序资料。

(2)偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换,或虽经变量变

换但仍未达到正态或近似正态分布时,宜用非参数检验。

(3)未知分布型资料

(4)要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。

(5)初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步

分析,挑选其中有意义者再进一步分析(包括参数统计内容)

(6)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作

出估计,在这种情况下可用非参数统计方法。

3.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一

组的相同数据不必计算“平均秩次?

因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组

内,出现相同数据不编平均秩次,该组秩和不受影响。

4.两样本比较的秩和检验当n

1

>10,n

2

-n

1

>10时采用u检验,这时检验是属于参数

检验还是非参数检验,为什么?

两组比较的秩和检验,当n大时,秩和分布近似正态分布,此时不必要再编制比n

更大的T检验界值表,而利用秩和分布随n增大渐近正态分布的性质,进行u检验,

故仍属于非参数检。

计算题:

1.试检验(表7-1)针刺不同穴位的镇痛效果有无差别?

(1)假设:Ho:三穴位镇痛效果的分布相同

H

1

:三穴位镇痛效果的不同或不全相同α=0.05

(2)计算检验统计量:

表7-1针刺不同穴位的镇痛效果

镇痛效果各穴位的观察频数秩次范围平均秩次

合谷足三里扶突合计

+3853471381~13869.5

++44292396139~234186.3

+++~293264.0

++++24163373294~366360.0

R

i

2462

n

i

6

R

i

185.89172.73192.31

H=12/[N(N+1)]×2

i

R/ni

-3(N+1)

=12/[366(366+1)×[219352/118+217642/126+234622/122]-3(366+1)

=2.212

C=1-Σ(3

i

t-ti

)/(N3-N)

=1-[(1383-138)+(963-96)+(953-95)+(733-73)]/(3663-366)

=1-0.0838=0.9162

H

C

=2.212/0.9162=2.414

(3)确定P值和作出推断结论:本题K=3,v=3-1=2,查附表9,X2界值表,得0.05

>P>0.25,按α=0.05水准,未拒绝Ho,尚不能认为三种穴位镇痛效果有差别。

2.某实验分别用两种方法对36件样品测定大肠菌指数,得表4-9资料,作t检验

(t=1.546,P>0.05),认为两法结果一致,你对此有何意见?

表7-2用两法测定36件水源水样品的结果

大肠菌指数DY-2法(样品数)发酵法(样品数)

95001

230063

940030

23000245

23800327

合计3636

均数18493.3321262.5

本实验数据应用t检验,存在下列问题:

(1)本实验属于配对设计,但整理成频数表已拆开原样本的对子,成为两组比较的

形式。

(2)频数分布呈极度偏态分布,不宜使用t检验

(3)应使用配对设计差值的符号秩和检验。

3.表7-3资料是12名宇航员航行前及返航后24小时的心率(次/分),问航行对心率

有无影响?

(1)假设:Ho:差值总体中位数Md=0

H

1

:差值总体中位数Md≠0α=0.05

(2)求检验统计量:

表7-3宇航前后24小时心率(次/分)

宇航员号航行前航行后差值秩次

(1)(2)(3)(4)(5)

17693-17-9

2716831

3706554

46165-4-3

58093-13-8

65978-19-11

77483-9-7

86279-17-10

97998-1912

107278-6-5

118490-6-6

12636032

T

+

=7T

-

=71

(3)确定P值和作出推断结论:任取T

=7或T

=71,查附表10,T界值

表,得P<0.01,在α=0.05水准上,拒绝Ho,接受H

1

,可以认为航行

对心率有影响。

4.配对比较两种方法治疗扁平足效果,记录如表7-4,问那种方法好?

(1)假设:Ho:两法疗效差值中位数Md=0

H

1

:Md≠0

α=0.05(2)求检验统计量:

表7-4甲乙两法治疗扁平足疗效比较

病例号甲法乙法差数秩次

(1)(2)(3)(4)=(2)-(3)(5)

1好1差3-2-9

2好1好10-

3好1差3-2-10

4好1中2-1-4.5

5差3中214.5

6中2差3-1-4.5

7好1中2-1-4

8好1差3-2-11

9中2中20-

10差3差30-

11好1中20-

12差3差30-

13好1中2-1-4.5

14中2差3-1-4.5

15好1中2-1-4.5

16中2差3-1-4.5

*1:好2:中3:差T

+

=4.5T

-

=761.5

(3)确定P值和作出推断结论:本题有5个差值d=0,故n=11,查附表10,

得P<0.01,在α=0.05水准上,拒绝Ho,接受H

1

,可认为甲法疗效优

于乙法。

5.表7-5为测得铅作业与非铅作业工人的血铅值(μmol/L),问两组工人的血铅值有

无差别

(1)假设:Ho:两组工人血铅值总体分布相同

H

1

:两组工人血铅值分布不同

α=0.05

(2)求检验统计量:

表7-5铅作业工人和非铅作业工人血铅值(μmol/L)比较

铅作业组非铅作业组

血铅值秩次血铅值秩次

0.8290.241

0.8710.50.242

0.97120.293

1.21140.334

1.64150.445

2.08160.586

2.13170.637

0.728

0.8710.5

10.113

n1=7T1=93.5n2=10T2=59.5

(3)确定P值和作出推断结论,本题较小例数n

1

=7两组例数之差n

2

-n

1

=10-7=3,

查附表11,得P<0.01,在α=0.05水准上拒绝Ho,接受H

1

,铅作业组平均

秩次为93.5/7=13.36,非铅作业平均秩次为59.5/10=5.95,可以认为铅作业

工人的血铅值高于非铅作业工人的血铅值。

6.比较表7-6两组肝炎婴儿的血清总胆红素有无差别?

(1)假设:Ho:两组肝炎婴儿的血清总胆红素总体分布相同

H

1

:两组肝炎婴儿的血清总胆红素总体分布不同

α=0.05

(2)求检验统计量:

表7-6两组肝炎婴儿的血清总胆红素

总胆红素人数秩次范围平均秩次秩和

μmol/L)一般组重症组合计一般组重症组

<17441~42.510

17~10105~149.595

80~1521715~312334546

160~191032~4136.536.5328.5

240~2242~4342.585

320~4444~4745.5182

400~2248~4948.597

合计301949T2=486.5T1=738.5

u=

]12/)1([

]5.02/)1([

21

11



Nnn

NnT

=397.5

12/)149()30(19

5.02/)149(195.738[





计算u

C

C=1-Σ()/()(33NNtt

ii



=1-[(43-4)+(103-10)+(173-17)+(103+10)+(23-2)+(43-4)(23-2)]

/(493-49)

=1-5208/117600=0.9557

u

C

=5.379/9557.0=5.520

(3)确定P值和作出推断结论:查附表2,t界值表,v=∞,得P<0.001,按α

=0.05水准,拒绝Ho,接受H

1

,可以认为重症组肝炎婴儿的血清总胆红素高

于一般组。

7.试检验表7-7三组人的血浆总皮质醇测定值有无差别?

(1)假设:Ho:三组人的血浆总皮质醇测定值总体分布相同

H

1

:三组人的血浆总皮质醇测定值总体分布不同或不全相同

α=0.05

(2)计算检验统计量如下表:

表7-7三组人的血浆总皮质醇测定值

正常人单纯性肥胖皮质醇增多症

测定值秩次测定值秩次测定值秩次

0.1110.1722.7020

0.5240.3332.8121

0.6160.5552.9222

0.6980.6673.5923

0.7790.8610.53.8625

0.8610.51.13144.0826

1.02121.38164.3027

1.08131.63174.3028

1.27152.04195.9629

1.92183.75246.6230

Ri96.5117.5251

Ni101010

H=12/[N(N+1)]×ΣR

i

2/n-3(N+1)

=12/[30(30+1)]×(96.52+117.52+2512)/10-3(30+1)=18.122

v=k-1=3-1=2,查附表9,X2界值表,得P<0.005,在α=0.05水准上拒绝

Ho,接受H

1

,可以认为三组人的血浆总皮质醇测定值分布不同。

(3)多样本两两比较如表4-7

Ho:任两组人的血浆总皮质醇测定值总体分布相同

H

1

:任两组人的血浆总皮质醇测定值总体分布不同

α=0.05

两两比较秩和差数的绝对值

各组秩和D=|RA-RB|

单纯性肥胖117.5皮质醇增多症251

正常人96.521154.5

单纯性肥胖117.5133.5

本题n=10,k=3,查附表13,D界值表,D

0.05(10,3)

=92.3,D

0.01(10,3)

=114.7,在

α=0.05水准上,皮质醇增多症与正常人、单纯性肥胖组比较,均拒绝Ho,接受H

1

可认为对比组间有差别(P<0.01),而单纯性肥胖与正常人相比,P>0.05,未拒

绝Ho,尚不能认为两组间的血浆总皮质醇测定值有差别。

8.在研究某地方病的病因工作中,用病区的粮食做动物实验,今有两组大白鼠,分别

用甲,乙两种饲料配方饲养,观察鼠的心肌坏死面积(小格数)如表7-8,问两组

间的坏死面积有无差别?本资料用t检验和秩和检验何者为好?为什么?

表7-8甲,乙两组心肌坏死面积(小格数)比较

甲组乙组

面积×频数秩和面积×频数秩和

0.0×1013×100.0×1513×15

0.2×12.750.2×32.75×3

0.3×130.50.3×130.5

0.4×233.5×20.4×233.5×2

0.6×1360.9×237.5×2

1.0×1391.3×140

1.6×1411.7×142

2.2×1432.8×145

2.6×1447.4×153

3.3×14613.0×155

4.3×1

5.1×1

5.4×1

5.5×1

6.1×1

6.2×1

9.7×1

13.8×1

36.0×1

合计n2=29T2=968n1=28T1=685

应用t检验的条件是所分析的数据来自正态分布总体,而且要求相应的两总

体方差相等,故首先列出两组数据的频数分布表。由频数表可见两组数据呈极

度偏态,且总体方差不齐(S甲2=50.32,S乙2=7.66,F6.569,P<0.05),故

应使用秩和检验。

(1)假设:Ho:两组坏死面积的分布相同

H

1

:两组坏死面积的分布不同

α=0.05

(2)计算检验统计量:

u=

12/)1(

5.02/)1([

21

11



Nnn

NnT

=

019.2

12/)157(2928

]5.02/)157(28685[





计算较正u

c

C=1-Σ(t3-t

i

)/(N3-N)

=1-[(253-25)+(43-4)+(23-2)+(43-4)]/(573-57)=0.9151

u

C

=111.29151.0/019.2/cu

(3)确定P值和作出推断结论:查附表2,t界值表,v=∞,得0.05>P>0.01,

在α=0.05水准上拒绝Ho,接受H

1

,故可以认为甲乙两组饲料配方饲养大鼠,

心肌坏死面积不同,甲组坏死面积较大。

第八章直线相关与回归

答案

填空题

1、Y

ˆ

=α+bx

2、依存关系,相互关系与密切程度

3、直线回归、截距、回归系数

4、-1——1

5、r与b假设检验是等价的

6、相关关系的密切程度和相关方向指标。

7、回归平方和(

Y

ˆ

-Y)2、剩余平方和Σ(Y-

Y

ˆ

)2

8、截距,回归系数,斜率

9、相互关系的密切程度,相关方向

是非题:

1.√2.×3.√4.√5.×6.×7.×8.√9.×10.√

单选题:

1.D2.C3.D4.D5.C6.D7.B8.D9.E10.B

11.E12.D13.E14.A15.B16.A17.B18.C19.C20.E

问答题:

1.应用直线回归和相关分析时应注意那些问题?

(1)作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相

关分析,必须对两种现象间的内在联系有所认识。

(2)在进行回归和相关分析之前,应绘制散点图。当观察点的分布有直线趋势时,才

适宜作回归、相关分析。如散点图呈明显曲线趋势,应使之直线化再行分析。散点图

还能提示资料有无可疑异常点。

(3)直线回归方程的实用范围一般以自变量的取值范围为限。若无充分理由证明超过

自变量取值范围外还是直线,应避免外延。

(4)双变量的小样本经t检验只能推断总体两变量间有无直线关系,而不能推断相关

的紧密程度,样本含量必须很大。

(5)相关关系不一定是因果关系,也可能是伴随关系,有相关关系不能证明事物间确

有内在联系。

2.用什么方法考察回归直线图示是否正确?

(1)直线必须通过点(YX,)。

(2)若纵横坐标无折断号时,将直线左端延长与纵轴相交,交点的纵坐标必等于截距

α。

(3)直线是否在自变量X的实测范围内。

3.r与r

s

的应用条件有何不同?

积差相关系数r用于描述双变量正态分布资料的相关关系。

等级相关系数r

s

适用于下列资料:

(1)不服从双变量正态分布而不宜作积差相关分析的资料。

(2)总体分布型未知的资料:

(3)原始数据是用等级表示的资料。

4.某资料n=100,X与Y的相关系数为r=0.2,可否认为X与Y有较密切的相关关系?

N=100,r=0.2时,对相关系数进行t检验,按检验水准α=0.05,拒绝Ho(ρ=0),

接受H

1

(ρ≠0),认为两变量有相关关系,但决定系数r2=0.22=0.04,表示回归

平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大。

5.相关系数与回归系数的区别与联系

(1)区别:

①资料要求上:回归要求因变量Y服从正态分布,X是可以精确测量和严

密控制的变量,称Ⅰ型回归;相关要求两个变量X、Y服从双变量正态

分布,这种资料若进行回归分析称为Ⅱ型回归

②应用上:说明两变量间依存变化数量关系用回归,说明变量间的相关关

系用相关。

③意义上:b表示X每增(减)一个单位,Y平均改变b个单位,r说明具

有直线关系的两个变量间相关关系的密切程度与相关方向。

④计算上:b=

XXXY

ll/,r=

YYXYXY

lll/

⑤取值范围:-∞<b<+∞;-1≤r≤1。

⑥单位:b有单位,r没单位。

(2)联系:

①对一组数据若同时计算b和r,它们的正负号一致

②b和r的假设检验是等价的,即对同一样本,t

b

=t

r

③用回归解释相关,决定系数r2=l

XY

2/l

XX

l

YY

=SS回/SS总,回归平方和越

接近总平方和,则r2越接近1,说明引入相关的效果越好。

计算题

1.10名20岁男青年身高(cm)与前臂长(cm)如下,问两者有无相关关系?

身高3180165

前臂长454244443

(1)计算相关系数:由原始数据及散点图的初步分析,估计本资料有直线趋势。

ΣΧ=1725,ΣΧ2=298525,

X

=172.5

ΣУ=454ΣУ2=20690,

Y

=45.4ΣΧУ=78541

XX

l

=ΣΧ2-(ΣΧ)2/n=298525-17252/10=962.5

YY

l

=ΣΧ2-(ΣΧ)2/n=20690-4542/10=78.4

XY

l

=ΣΧУ-(ΣΧ)(ΣУ)/n=78541-1725×454/10=226

(2)与ρ=0进行假设检验。

Ho:ρ=0,即身高与前臂长间无直线相关关系

H

1

:ρ=0,即身高与前臂长间有直线相关关系

α=0.05

υ=n-2=10-2=8

查t界值表,得0.002<P<0.005,按α=0.05水准拒绝Ho,

2.某省卫生防疫站对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘行检

测,结果见表,试检验两者有无相关?

表8-18个城市肺癌标化死亡率与大气中苯并(a)芘的相关分析

肺癌标化死亡率(1/10万)

__________________________________________________________________________

城市编号X等级Y等级dd2

(1)(2)(3)(4)(5)(6)=(3)-(5)(7)

15.6010.05100

218.5081.17711

316.2361.05600

411.4030.10211

513.8050.75500

68.1320.503-11

718.0070.65439

812.1041.208416

∑d2=28

本题资料不服从双变量正态分布,宜计算等级相关系数。

Ho:ρ

S

=0,即肺癌标化死亡率与大气中苯并(α)芘无相关关系

H

1

:ρ

S

≠0,即肺癌标化死亡率与大气中苯并(α)芘有相关关系

α=0.05

由上计算表,r

S

=1-6Σd2/[n(n2-1)]=1-6×28/[8×(82-1)]=0.6667查附表15,

r

S

界值表,得0.10>P>0.05,按α=0.05水准不拒绝Ho,尚不能认为肺癌标化死

亡率与大气中苯并(α)芘间有相关关系。

3.就表8-2(1)(2)(4)栏资料分析血小板和出血症的关系。

表8-2血小板数与出血症状的等级相关分析

血小板数(×109/L)出血症状

病例号X等级Y等级dd2

(1)(2)(3)(4)(5)(6)=(3)-(5)(7)

11201++10.5-9.590.25

21302+++12.0-10.0100.00

31603±7.0-4.016.00

43104-3.50.50.25

54205+8.5-3.512.25

65406+8.5-2.56.25

77407-3.53.512.25

810608-3.54.520.25

9126010-3.56.542.25

1012309-3.55.530.25

11144011++10.50.50.25

12200012-3.58.572.25

∑d2=402.5

本例“出血症状”为等级数据,宜计算等级相关系数。

Ho:ρ=0,即血小板数与出血症无相关关系

H

1

:ρ≠0,即血小板数与出血症有相关关系

α=0.05因出血症状Y中相同秩次较多,需计算校正r

S

值r,

S

X

T=0

Y

T=Σ(t3-t)/12=[(63-6)+(23-2)+(23-2)]/12=18.5

=

5.182]6/)1212[(0]6/)1212[(

5.402)5.180(]6/)1212[(

33

3





=-0.5059

查附表15,r

S

界值表,得0.10>P>0.05,按α=0.05水准,不拒绝Ho,尚

不能认为血小板数与出血症状间有相关关系

4.某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量(g)

和体重增加量(g)的数据如下:

表8-3八只大白鼠进食量(g)和体重增加量(g)

鼠号12345678

进食量(g)89

体重增加(g)3

(1)此资料有无可疑的异常点

(2)求直线回归方程并对回归系数作假设检验.

(3)试估计进食量为900g时,大白鼠的体重平均增加多少,计算其95%的可信区

间,并说明其含义.

(4)求进食量为900g时,个体Y值的95%容许区间,并解释其意义.

解:(1)由散点图及回归直线综合分析,点(800,185)可视为异常点.

(2)有原始数据求得直线方程

对回归系数作检验

Ho:=0,即进食量与增重无直线关系

H1:0,即进食量与增重有直线关系

=0.05

方差分析法

SS

=

7v,875.4052lyy

查F界值表,得P<0.05,按

=0.05的水准,拒绝Ho,接受H

1

可认为进食量与增重间

有直线关系.

t检验法

查t界值表,得P<0.01结论同上.

第九章统计图表

答案

填空题

1.突出重点,简单扼要,主谓分明,层次清楚。

2.标题,标目,线条,数字,备注。

3.频数分布图(直方图)。

是非题

1.√2.√3.×4.√5.×6.×7.×

单选题:

1.A2.B3.D4.E5.D6.D7.D8.B9.D10.C

11.E12.D13.E14.E15.C16.E17.A18.C19.B20.E

21.C

问答题:

1.列表的原则和基本要求是什么?

(1)列表的原则:重点突出,简单明了;主谓分明,层次清楚。

(2)列表的基本要求:

①应有简明扼要说明统计表内容的标题。既不能过与简略,也不呢能过于繁琐

或不确切。

②标目文字要简明,有单位的标目要注明,标目不宜过多,层次应清楚。

③线条不宜过多。除顶线、底线、纵标目下与合计行上面的线条外,其他线条

一般均应省去。表的左上角不宜有斜线。

④表内数字小数位数保留应一致,位次应对齐,不宜留空格。暂缺或未记录用

“…”表示,无数字用“—”表示,数字是“0”则应填写“0”。

⑤备注一般不列入表内,应用“*”号引出,写在表的下面。

2.常用的统计图有哪几种?他们的适用条件是什么?

常用的统计图有条图、百分条图、圆图、线图、半对数线图、直方图、散点图

和统计地图等。

(1)直条图:用等宽直条的长短来表示相互独立的各项指标的数值大小,如发病率等。

(2)百分条图、圆图:用长条各段的面积、圆的扇形面积来表示事物内部各构成部分

的分布情况,即各构成比重的大小,如构成比。

(3)普通线图:用线段的升降来表示连续性资料随时间的变迁、某事物现象的动态及

变化趋势。

(4)半对数线图:用线段的升降来表示连续性资料随时间的变迁和某事物现象发展变

化的速度。

(5)直方图:用直方面积的大小表示数值变量资料频数分布的情况。

(6)散点图:用点的密集程度和趋势表示两变量间的相关关系。

(7)统计地图:用不同的纹线或颜色说明指标高低,描述某事物现象在行政区域上的

分布情况。

3.某医院对麦芽根糖浆治疗急慢性肝炎161例的疗效列表9-1,试作改进。

表9-1麦芽根糖浆治疗急慢性肝炎疗效观察

效果

例数

有效

无效

小计近期痊愈好转

例%例%例%例%

16110867.17043.53823.65332.9

改后如下表:

表9-2麦芽根糖浆治疗急慢性肝炎疗效观察

疗效例数疗效构成比(%)

无效5332.92

好转3823.60

近期痊愈7043.48

合计161100.00

计算题

1.某防疫站1972年开始在城关建立“预防接种卡”使计划免疫得到加强。为说明

果,1975年的5月观察了482人的锡克试验反应,其中:幼儿园儿童101人,阳性

21人,小学生145人,阳性22人;中学生236人,阳性15人。相比起来,1974

年为:幼儿园儿童144人,阳性37人,小学生1417人,阳性323人;中学生259

人,阳性41人。试用适当的统计表和统计图描述上述结果,并作简要分析(表9-3)

表9-3某县两年不同人群锡克试验反应结果分析

19741975

调查人数阳性人数阳性率(%)调查人数阳性人数阳性率(%)

幼儿园1443725.691012120.79

小学生141732322.791452215.17

中学生3594111.42236156.36

第十章实验与调查设计

答案

填空题

1、处理因素,受式对象,实验效应

2、对照原则,均衡原则,随机化原则,重复原则

3、第一类错误概率α即检验水准,检验效能1-β,容许误差,总体标准差或用“S”

来代替

4、空白对照,实验对照,标准对照,历史对照,自身对照,相互对照,

5、普查,非全面(抽样调查)典型调查

6、单纯随机抽样,系统抽样,整群抽样,分层抽样

7、标准对照

是非题:

1.√2.√3.√4.×5.√6.√7.×8.×9.×

单选题:

1.E2.C3.E4.D5.D6.C7.A8.D9.B10.D

11.A12.A13.E14.C15.D16.C

问答题:

1.1976年某单位报告了果胶驱铅的疗效观察。30名铅中毒工人脱离现场后住院治疗,

治疗前测得尿铅的均数为0.116mg/L,血铅均数为1.81mg/L。服用20天后再测,尿

铅均数降为0.087mg/L,血铅均数降为0.73mg/L。说明果胶驱铅有较好的驱铅作用。

此实验目的是要观察果胶的驱铅作用。人体对外来有害物质有解毒功能,因而铅

中毒者在脱离现场后经一段时间,血、尿中铅含量会下降(自然排铅)。该设计最

大缺点就在于无对照,其结果不知血铅和尿铅的下降是果胶的作用,还是人体自然

排铅的结果。另外,只凭上述血铅和尿铅在治疗前后的均数,不作假设检验就下“果

胶有较好的驱铅作用”的结论自然不妥,较好的设计应将30名患者随机分为两组,

一组给予果胶,另一组给予具有肯定作用的驱铅药物如EDTA(即标准对照)等,经

治疗一定时间后,以两组血铅及尿铅的变化值作假设检验,再下结论。

2.某单位研究菊花艾叶香预防感冒及空气消毒效果,对象为某幼儿园分住三个楼的儿

童。中楼是中班的儿童(160人),东楼是小班(80人)的儿童,此两楼燃香;西楼

是大班(160人)的儿童,不燃香为对照组,结论为该艾叶香无预防感冒效果,但有

空气消毒作用(肉汤平板上菌落数较少)。

该试验目的是观察野菊花艾叶香预防感冒和空气消毒的作用,但三组之间缺乏

均衡性:

(1)三栋楼房条件不同。

(2)三组儿童年龄不同:不同年龄儿童对感冒抵抗力不同,大班儿童自然会比中班、

小班儿童对感冒抵抗力强,故无法观察预防感冒的作用。

(3)设立对照也有问题,空气消毒是野菊花艾叶香的燃香作用,还是烟作用无法区

别,故达不到试验目的。应设立实验对照。

3.为寻找营养丰富而有经济实惠的婴幼儿食品,以搞好儿童保健,某研究所利用甘蔗

废糖蜜试制了L-赖氨酸(简称赖氨酸盐)。通过实验研究了解膳食中添加赖氨酸盐

后对正常儿童生长发育有无影响,如何考虑:

(1)实验组与对照组的设置均衡性:

实验组与对照组条件要均衡,除处理因素外,其它条件应尽量相同,因此应

选全托儿所的同龄、身体发育正常、健康的儿童作为观察对象,使实验组与对照

组应在性别、年龄、生活条件、健康知识等有关因素尽量做到相近。

(2)实验对象的随机化分配方法:

将符合条件的实验对象依花名册顺序号,使用随机数字表,按随机原则进行分组。

样本含量借助参考文献各项指标的数据,设定α,1-β进行样本例数估计。

(3)实验持续时间及观察指标、项目:

实验持续时间的确定以能看出显着变化为原则,如持续时间短,区别不出效

应指标的变化;而持续时间过长,则给试验带来较多的困难与人力、物质的浪费。

观察指标:①形态指标:身高、体重、胸围、坐高、皮下脂肪厚度等;②功能指

标:脉搏、血压、肺活量、呼吸次数等;③生化指标:Hb(g/L)、WBC(×

109/L)等。

(4)统计分析表及统计分析方法:

1)计算各项指标实验前、后均值、标准差(见表)。

2)作统计分析以了解每组实验前后标化是否有统计意义,可按组别对各项指标受

试前后进行配对t检验,再对两组实验前后的差数用成组设计两均数比较的t

检验,检验实验组与对照组各项指标差别有无统计意义。

表不同食物组实验前后儿童生长发育指标比较(

X

±S)

指标普通食物组加赖氨酸盐组

实验前实验后实验前实验后

身高(cm)

体重(kg)

脉搏(次/分)

血压(kPa)

Hb(g/L)

WBC(×109/L)

4.调查研究和实验研究的主要区别何在?

按研究是否对观察对象施加干预(即处理因素)可分为调查与实验。调查即研究

者只是被动的调查客观实际情况,而未加任何干预。实验比调查能更好地控制误差。

基于上述差别,调查与实验研究在统计分析上也不尽相同。

(1)调查研究:①研究因素(处理因素)是客观存在的;②不能通过随机化分组的方

法来平衡混杂因素。

(2)实验研究:①研究者能人为设置处理因素;②受试对象接受何种处理因素或水平

是由随机分配而定。

5.估计样本例数的意义何在?需要确定那些前提条件?

(1)估计样本例数的意义:在调查或实验研究中都要对样本例数进行估计,如果例数

太少,有可能把个别情况误认为普遍情况,把偶然性或巧合的现象当做必然规律

现象,以至错误地推论到总体,例数太多,势必造成人力、物力的浪费。在保证

实验结果有一定可靠性的条件下,确定最少的样本例数,以节约人力和经费。

(2)样本含量的估计可分为两类,一类是作参数估计时的样本含量估计;另一类是作

指标比较时的假设检验中样本含量的估计。两种方法不同,决定样本含量的因素

亦有所不同。现分述如下。

1)参数估计时,影响样本含量的因素有:①容许误差δ。容许误差越小,所需

样本含量越多;②Ⅰ型错误的概率α。α越小,则所需样本含量越多;③总体

标准差σ。σ越大,所需样本含量越大;④总体是无限总体,所需样本含量

较多;如系有限总体则总体单位数越小,所需样本含量也越少。

2)指标比较时,决定样本含量的因素是:①Ⅰ型误差的概率α。α越小,样本含

量越大;②检验效能1-β。β为Ⅱ型误差的概率,1-β越大,所需样本含量

越大;③容许误差δ。δ越小则样本含量越大;④总体标准差σ或总体率

π。σ越小,n越小,π越接近0.5样本含量越大;⑤单侧检验所需样本含

量较少,双侧检验所需样本含量较多。

6.调查研究和实验研究的只要区别何在?

按研究是否对观察对象施加干预(即处理因素)可分为调查与实验。调查即研

究者只是被动的调查客观实际情况,而未加任何干预。实验比调查能更好地控制误

差。基于上述差别,调查与实验研究在统计分析上也不尽相同。

(1)调查研究:①研究因素(处理因素)是客观存在的;②不能通过随机化分组

的方法来平衡混杂因素。

(3)实验研究:①研究者能人为设置处理因素;②受试对象接受何种处理因素

或水平是由随机分配而定。

7.估计样本例数的意义何在?需要确定那些前提条件?如何进行估算?

(1)估计样本例数的意义:在调查或实验研究中都要对样本例数进行估计,如

果例数太少,有可能把个别情况误认为普遍情况,把偶然性或巧合的现象当

做必然规律现象,以至错误地推论到总体,例数太多,势必造成人力、物力

的浪费。在保证实验结果有一定可靠性的条件下,确定最少的样本例数,以

节约人力和经费。

(2)样本含量的估计可分为两类,一类是作参数估计时的样本含量估计;另一

类是作指标比较时的假设检验中样本含量的估计。两种方法不同,决定样本

含量的因素亦有所不同。现分述如下。

1)参数估计时,影响样本含量的因素有:①容许误差δ。容许误差越小,所

需样本含量越多;②Ⅰ型错误的概率α。α越小,则所需样本含量越多;③

总体标准差σ。σ越大,所需样本含量越大;④总体是无限总体,所需样本

含量较多;如系有限总体则总体单位数越小,所需样本含量也越少。

2)指标比较时,决定样本含量的因素是:①Ⅰ型误差的概率α。α越小,样本

含量越大;②检验效能1-β。β为Ⅱ型误差的概率,1-β越大,所需样本含

量越大;③容许误差δ。δ越小则样本含量越大;④总体标准差σ或总体

率π。σ越小,n越小,π越接近0.5样本含量越大;⑤单侧检验所需样本

含量较少,双侧检验所需样本含量较多。

如何进行样本含量估算,根据已知条件,区别调查研究还是实验中统计量的

比较,以及数值变量还是分类变量,可按样本估计的专用公式计算,或查样

本例数估计专用表。

8.实验为什么要设对照组?如何设对照组?

设对照可以使处理因素和非处理因素的差异有一个科学的对比。

设立对照的目的是抵消对照组与处理组非处理因素的影响,处理因素效应得以充

分显示出来。主要有空白对照、安慰剂对照、实验对照、标准对照、历史对照、

自身对照和相互对照等六种形式,可以根据研究目的和内容加以选择。

9.常用的实验设计有那些?

(1)完全随机设计。亦称单因素设计

(2)配对设计

(3)配伍组设计,亦称随机区组设计,是配对设计的扩大。

(4)析因试验设计、拉丁方设计、正交设计,这些都是多因素,高效率的实验设计。

计算题

1.根据既往观察,人群接种某预防制剂后,体温高于37.5℃的反应率为10%,今欲推

广使用,拟再次证实,要求容许误差在真实反应率的20%以内,α=0.05,问按单

纯随机抽样需观察多少人?

本题为调查总体率的样本含量估计。已知:

π=0.1,δ=0.2×π=0.2×0.1=0.02,双侧u

0.05

=1.96

n=

2

a

u(1-π)/δ2

=1.962×0.1×0.9/(0.2×0.1)2≈865(人)

2.拟用放射免疫法检测某人群(5000人)血液中流行性脑脊髓膜炎(流脑)特异免

疫球蛋白含量,根据文献报告,本例为计量资料有限总体抽样的样本含量估计,其

标准差为0.5mg/L,容许误差为0.1ml/L,试按单纯随机抽样估计样本例数。

已知:N=5000,σ=0.5μg/ml,δ=0.1μg/ml。

若规定:双侧α=0.05,u

0.05

=1.96

则:n=(U

α

σ/δ)2=(1.96×0.5/0.1)2=96.04≈97(人)

n

C

=n/(1+n/N)=97/(1+97/5000)

=95.15≈96(人)

3.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,将

全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果如表

10-1,试估计该县百白破疫苗接种率的95%可信区间。

表10-1某县三类乡百白破疫苗接种率调查结果

类别人数抽样人数接种率

好73717230.8174

较好1489914780.6969

差93089300.3022

合计315783131

本题为求按比例分配的分层抽样中总体率的可信区间,首先计算接种率及其标准

误。

(1)p=[ΣΝ

i

Ρ

i

]/Ν=[7371×0.8174+14899×0.6969+9308×0.3022]/31578

=19221.0461/31578=0.608685

(2)NnppNnNs

iiiiip

/)1/()1()[(/1(2

=31578/)}1930/(6978.03022.0)[9308/9301(

2

9308)]1723/(1826.08174.0)[7371/7231(

2

7371

=0.007520

该率不接近于0或1,一般认为服从二项分布。因n=3131,较大,可用正态近似法

计算其可信区间。

95%CI:P±1.96Sp=0.608635±1.96×0.007520=(0.5939,0.6234)

👁️ 阅读量:0