
医学统计学第七版课后答案及解析
充电桩项目-交流调压电路
2023年2月20日发(作者:铁路网上售票系统)医学统计学
第一章绪论
答案
名词解释:
(1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基
础上各观察单位(或个体)之间的差异。
(2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本
是从总体中随机抽取的部分观察单位。
(3)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称
为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为
样本统计量。
(4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误
差。
(5)概率:是描述随机事件发生的可能性大小的数值,用p表示
(6)计量资料:由一群个体的变量值构成的资料称为计量资料。
(7)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称
为计数资料。。
(8)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为
等级资料。
是非题:
1.×2.×3.×4.×5.√6.√7.×
单选题:
1.C2.E3.D4.C5.D6.B
第二章计量资料统计描述及正态分布
答案
名词解释:
1.平均数是描述数据分布集中趋势(中心位置)和平均水平的指标
2.标准差是描述数据分布离散程度(或变量变化的变异程度)的指标
3.标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布
称为标准状态分布。
4.参考值范围参考值范围也称正常值范围,医学上常把把绝
大多数的某指
标范围称为指标的正常值范围。
填空题:
1.计量,计数,等级
2.设计,收集资料,分析资料,整理资料。
3.
u(变量变换)标准正态分布、0、1
4.96.158.268.27%95%99%
5.47.5%
6.均数、标准差
7.全距、方差、标准差、变异系数
8.96.158.2
9.全距R
10.检验水准、显着性水准、0.05、0.01(0.1)
11.80%90%95%99%95%
12.95%99%
13.集中趋势、离散趋势
14.中位数
15.同质基础,合理分组
16.均数,均数,μ,σ,规律性
17.标准差
18.单位不同,均数相差较大
是非题:
1.×2.√3.×4.×5.×6.√7.√8.√9.√10.√
11.√12.√13.×14.√15.√16.×17.×18.×19.√20.√
21.√
单选题:
1.B2.D3.C4.A5.C6.D7.E8.A9.C10.D
11.B12.C13.C14.C15.A16.C17.E18.C19.D20.C
21.B22.B23.E24.C25.A26.C27.B28.D29.D30.D
31.A32.E33.D34.A35.D36.D37.C38.E39.D40.B
41.C42.B43.D44.C45.B
问答题:
1.均数﹑几何均数和中位数的适用范围有何异同?
答:相同点,均表示计量资料集中趋势的指标。
不同点:表2-5.
表2-5均数,几何均数和中位数的相异点
平均数意义应用场合
均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布
几何均数平均增减倍数①等比资料;②对数正态分布资料
中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两
察值水平端出现不确定值
2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?
答:
1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,
反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某
百分位置的水平,最常用的百分位是P
50
即中位数。多个百分位数结合使用,可
更全面地描述总体或样本的分布特征。
(2)计算:中位数和百分位数均可用同一公式计算,即
Px=L+(i/f
x
)(n·x%-Σf
L
)
可根据研究目的选择不同的百分位数代入公式进行计算分析。
(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考
值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中
更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。
3.同一资料的标准差是否一定小于均数?
答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。
变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?
(1)样本含量的大小,样本含量越大,标准差越稳定。
(2)分组的多少
(3)分布形状的影响,偏态分布的标准差较近似正态分布大
(4)随机测量误差大小的影响
(5)研究总体中观察值之间变异程度大小
5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?
(1)概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的
连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边
对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示
方法不同,正态分布用N(μ,σ2)表示,标准正态分布用N(0,1)表示,对
数正态分布N(μ
lgX
,σ2
lgX
)表示。
(2)应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。
②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一
的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数
变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用
于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。
6.医学中参考值范围的含义是什么?确定的原则和方法是什么?
含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关
疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解
剖、生理、生化等数据绝大多数人的波动范围。
(2)原则:
①抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结
果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为
稳定的样本为原则。
②对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值
范围的前提。
③判定是否要分组(如男女、年龄、地区等)确定正常值范围。
④决定取双侧范围值还是单侧范围值。
⑤选择适当的百分范围
⑥确定可疑范围
⑦估计界值
(3)方法:
①百分位数法:P
x
=L+(i/f
x
)(n·x%-Σf
L
)
②正态分布法(对数正态分布):
百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近
似正态分布(服从对数正态分布)的资料。
7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?
答:不一定。均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正
态分布。
计算题:
1.某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:
4.773.376.143.953.564.234.314.715.694.12
4.564.375.396.305.217.225.543.935.216.51
5.185.774.795.125.205.104.7040743.504.69
4.384.896.255.324.504.633.614.444.434.25
4.035.854.093.354.084.795.304.973.183.97
5.165.105.864.795.344.244.324.776.366.38
4.865.553.044.553.354.874.175.855.165.09
4.524.384.314.585.726.554.764.614.174.03
4.473.043.912.704.604.095.965.484.404.55
5.383.894.604.473.644.345.186.143.244.90
3.05
(1)编制频数分布表,简述其分布特征。
①找出最大值、最小值求全距(R):
全距=最大值-最小值=7.22-2.70=4.50(mmol/L)
②求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L)
③分组段,划记(表1-1)
表2-6某地101例30~49岁健康男子血清总胆固醇值划记表
组段(mmol/L)划记频数
2.5~1
3.0~8
3.5~9
4.0~23
4.5~25
5.0~17
5.5~9
6.0~6
6.5~2
7.0~7.51
合计101
由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。
表2-7某地101例30~49岁健康男子血清总胆固醇值(mmol/L)X、s计算表
血清总胆组中值频数fXfX2累计累计频数
固醇值Xf频数(实际)
2.5~2.7512.757.56310.0099
3.0~3.25826.0084.50090.0891
3.5~3.75933.75126.563180.1782
4.0~4.252397.75415.438410.4059
4.5~4.7525118.75564.063660.6535
5.0~5.251789.25468.563830.8218
5.5~5.75951.75297.563920.9109
6.0~6.25637.50234.375980.9703
6.5~6.75213.5091.1251000.9901
7.0~7.57.2517.2552.5631011.0000
478.252242.315
注:Xu为组段上限值
(2)计算均数
X
、标准s、变异系数CV。
由上计算表1-2可见:ffXX/478.25/101=4.735(mmol/L)
1101
101/)25.478(313.23422
=0.882(mmol/L)
CV=xs/100%=0.882/4.735100%=18.627%
(3)计算中位数M,并与均数X比较,利用前表计算中位数M
M=L+(i/f
50
)(n50%-Σf
L
)
=4.5+(0.5/25)(10150%-41)=4.69(mmol/L)
本题算术均数为4.735(mmol/L),与中位数4.69(mmol/L)很接近,这也是
资料服从正态分布的特征之一。
(4)计算P2.5及P97.5并与X±1.96s的范围比较。
P
2。5
=3.0+(0.5/8)(1012.5%-1)=3.095(mmol/L)
P
97.5
=6.5+(0.5/2)(10197.5%-98)=6.619(mmol/L)
X1.96
S
=4.735±1.960.882=3.01~6.46(mmol/L)
用百分位数法求得101例30~49岁健康男子血清总胆固醇值95%分布范围
3.095~6.619(mmol/L),与正态分布法求得的95%分布范围3.01~6.46
(mmol/L)基本一致。
(5)分别考察X1
S
、X1.96
S
、X2.58
S
范围内的实际频数与理论分布是否基
本一致(表1-3)
表2-8某地101例30~49岁健康男子血清总胆固醇值理论分布与实际分布比较
usX血清总胆固醇实际分布理论分布
人数%%
sX13.85~5.627271.2968.27
sX96.13.01~6.469796.0495.00
sX58.22.46~7.0110099.0199.00
由上表,
sX1
范围内,实际分布与理论分布略有不同,而
sX96.1
、
sX58.2
范围内,实际分布与理论分布基本一致。
(6)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值
范围估计,其血清总胆固醇值是否正常?估计该地30~49岁健康男子中,
还有百分之几的人血清总胆固醇值比他高?
前计算得95%正常值为3.01~6.46(mmol/L)现测得一40岁男子的血清总
胆固醇值为6.993(mmol/L),在95%范围以外,故属于异常
u=(X-μ)/σ=(6.993-4.735)/0.882=2.56
因ф(2.56)=ф(-2.56),查表1得ф(-2.56)=0.0052
估计该地30~49健康男子中约有0.52%的人血清总胆固醇值比他高。
2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑
制抗体滴度资料如表2-9第(1)(2)栏。
表2-9平均滴度计算表
抗体滴度人数f滴度倒数X1lgX1flgX1
(1)(2)(3)(4)(5)=(2)×(4)
1:8280.90311.8062
1:166161.20417.2247
1:325321.50517.5257
1:6410641.806218.0618
1:12841282.10728.4288
1:25622562.40824.8165
1:51215122.70932.7093
合计3050.5730
(1)试计算其平均滴度。
由表1-4得,G=lg-1(50.5730/30)=lg-11.6858=48.5
该站30名麻疹易感儿童经气溶胶免疫一个月后,测得血凝抑制抗体平均滴度为
1:48.50
表2-10平均滴度计算表
抗体滴度人数f滴度倒数X
1
lgX
1
flgX
1
(1)(2)(3)(4)(5)=(2)(4)
1﹕8280.90311.8062
1﹕166161.20417.2247
1﹕325321.50517.5257
1﹕6410641.806218.0618
1﹕12841282.10728.4288
1﹕25622562.40824.8165
1﹕51215122.70932.7093
合计3050.5730
(2)有人发现本例用抗体滴度稀释倍数和直接用滴度(原书误为倒数)算得对
数值的标准差相同,为什么?
表2-11滴度对数值计算表
抗体滴度X
2
人数flgX
2
flgX
2
1﹕82-0.9031-1.8062
1﹕166-1.2041-7.2247
1﹕325-1.5051-7.5257
1﹕6410-1.8062-18.0618
1﹕1284-2.1072-8.4288
1﹕2562-2.4082-4.8165
1﹕5121-2.7093-2.7093
合计30-50.5730
1)由表1-4中数据计算标准差为:slgx
1
=lg-10.4444=2.7823
2)由表1-5中数据计算标准差为:slgx
2
=lg-10.4444=2.7823
直接用抗体滴度的对数lgx
2
与稀释倍数的对数lgx
1
计算标准差是相等的,因
为由上表可见lgx
2
=lg1-lgX
1
=-lgx
1
,而lgx
1
与-lgx
1
的离散程度是相同的,所以用
抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。
3.50例链球菌咽峡炎患者的潜伏期如表2-12,说明用均数、中位数或几何均数,
何者的代表性较好?并作计算。
表2-1250例链球菌咽峡炎患者的潜伏期的中位数计算表
潜伏期(小时)病例数f累计频数
12~11
24~78
36~1119
48~1130
60~7
72~5
84~4
96~2
108~1202
合计50
本例目测频数分布为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几
何均数表示其平均水平。
如上表,经计算中位数,几何均数、算术均数分别为:
M=54.55(小时),G=54.08(小时),X=58.56(小时)显然,算术均数受长潜
伏期的影响使其偏大,中位数M与几何均数G接近,故描述链球菌咽峡炎患者潜伏
期的集中趋势指标使用中位数M或几何均数G均可。
4.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查
了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量
如表2-13:
表2-13238人发汞含量频数计算表
发汞值人数f组中值XfXfX2累计频数累计频率
(μmol/kg)
1.5~202.550.0125.00208.40
3.5~664.5297.01336.508636.10
5.5~606.5390.02535.0014661.34
7.5~488.5408.03468.0019481.50
9.5~1810.5189.01984.5021289.08
11.5~1612.5200.02500.0022895.80
13.5~614.587.01261.5023498.32
15.5~116.516.5272.2523598.74
17.5~018.50.00.0023598.74
19.5~21.5320.561.51260.75238100.00
合计2381699.014743.50
(1).说明此频数分布的特征:可见发汞值的频数分布高峰位于第2个组段。前
4个组段的频数占总频数的81.5%,长尾拖向右侧,呈极度正偏态。
(2).计算均数和中位数M,何者较大?为什么?何者用语说明本资料的集中
位置较合适?
ffXX/=1699/238=7.139(μmol/kg)
M=L+(i/f
50
)(n50%-Σf
L
)
=5.5+2/60(23850%-86)=6.6(μmol/kg)
由计算结果得知,
MX
其原因因为本例呈正态分布,均数计算结果受到少
数较大发汞值的影响,使得X偏向大发汞值一边.本例用中位数描述偏态资
料的集中趋势较好,它不受两端较大值和极小值的影响.
(3).选用何种指标描述其离散程度较好
选用四分位数间距描述其离散程度较好.
(4).估计该地居民发汞值的95%参考值范围
本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大,
n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范
围较为合适.
P
95
=L+(i/f
95
)(n95%-Σf
L
)
=11.5+(2/16)(23895%-212)=13.2625(μmol/kg)
第三章均数的抽样误差与t检验
答案
填空题:
1.标准误
2.0.05,0.01
3.假设检验,(显着性检验)
4.两总体均数不同(越有理由说明有统计学意义)
5.自由度大小
6.一是准确度、二是精度
7.抽样误差、样本均数、总体均数
8.总体均数估计、假设检验
9.第二类错误(Ⅱ型错误)β
是非题:
1.√2.×3.×4.×5.√6.√7.×8.√9.×10.√
11.√12.×13.√14.√15.√16.√17.√18.√19.×20.×
21.×22.×
单选题:
1.A2.E3.D4.E5.E6.E7.D8.A9.D10.D
11.D12.B13.E14.D15.D16.E17.B18.C19.C20.D
21.C
问答题:
1.标准差和标准误有何区别和联系?
表3-6标准差与标准误的区别
标准差(α或s)标准误(
xsxa或
)
意义上描述一组变量值之间的离散趋势描述样本均数间的离散趋势
应用上①s越小,表示变量值围绕①xs越小,表示样本均数与
均值分布越密集,说明均数总体均数越接近,说明样本
的代表性越好。均数推断总体均数可靠性越大。
②可用suX
a
估计变量值分②可用xstX
va
,估计总体
布范围均数可信区间
与n的关系n越大,s越趋于稳定n越大,xs越小
(2)联系
①二者均是表示变异度大小的统计指标。
②标准误
n/x
与标准差大小成正比,与抽样例数n的平方根成反
比。
③当n一定时,同一份资料,标准差越大,标准误也越大。
2.可信区间和参考值范围有何不同?
参考值范围是指同质总体中个体变量值的分布范围,如X±1.96s说明有
95%的变量值分布在此范围内,它与标准差的大小有关,若个体变异越大,
该范围越宽,分布也就越散。而可信区间是指在可信度为(1-α)时,估
计总体参数可能存在的范围。即从同一总体中随机抽样,当n一定时,每
抽一次即可得一个样本均值,以xstX
va
,计算可信区间,如95%可信区间,
类似的随机抽样进行一百次,平均有95次,即有95个可信区间包括了总
体均数,有5次没有包括括总体均数,5%是小概率事件,实际发生的可能
性很小,因此实际应用中就认为总体均数在求得的可信区间。这种估计方
法犯错误的可能性最大不超过5%。可信区间与标准误大小有关,标准误越
大,可信区间则越大。
3.假设检验和区间估计有何联系?
假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间
是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信
区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比
假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为
假设检验可得到P值,比较精确地说明结论的概率保证,而可信区间只能告
诉我们在某α水准上有无统计意义,却不能像P那样提供精确的概率。因此,
只有将二者有机地结合起来,相互补充,才是完整的分析。
4.假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么
假设检验时,当P<0.05,则拒绝Ho,其理论依据是在Ho成立的条件下,
出现大于等于现有检验统计量的概率P<0.05,它是小概率事件,即在一次
抽样中得到这么小概率是事件是不大可能发生的,因而拒绝它。由此可见,
假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。
5.t检验和方差分析的应用条件有何异同?
(1)相同点:在均数比较中,t检验和方差分析均要求各样本来自正态总体;各处理
组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。
(1)不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可
进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方
差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。
6.怎样正确使用单侧检验和双侧检验?
根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可
能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心
其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有
探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率
高,但应慎用。
7.第一类错误与第二类错误的区别及联系何在?了解这两类错误有何实际意义?
(1)假设检验中Ⅰ、Ⅱ型错误的区别。
Ⅰ型错误是拒绝了实际上成立的Ho,也称为“弃真”错误,用α表
示。统计推断时,根据研究者的要求来确定。
Ⅱ型错误是不拒绝实际上不成立的Ho,也称为“存伪”错误,用β
表示。它只能与特定的H
1
结合起来才有意义,一般难以确切估计。
(2)Ⅰ、Ⅱ型错误的联系。
①当抽样例数一定时,α越大,β越小;反之,α越小,β越大。
②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,
可适当增加样本含量。
③根据研究者要求,n一定时,可通过确定α水平来控制β大小。
(3)了解两类错误的实际意义。
①可用于样本含量的估计。
②可用来计算可信度(1-α),表明统计推断可靠性的大小。
③可用于计算把握度(1-β),来评价检验方法的效能等。
④有助于研究者选择适当的检验水准。
⑤可以说明统计结论的概率保证。
计算题:
1.某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:
表3-7:健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算
性别例数均数标准差标准值变异系数(%)标准误
红细胞数男3604.660.584.8412.450.0306
(×1012/L)女2254.180.294.336.940.0182
血红蛋白男360134.57.1140.25.280.3742
(g/L)女255117.610.2124.78.670.6387
(1)说明女性的红细胞数与血红蛋白量的变异程度何者为大?
女性CV
RBC
=S/
x
×100%=0.29/4.18×100%=6.49%
CV
HB
=S/
x
×100%=10.2/117.6×100%=8.67%
由上计算可知该地女性血红蛋白量比红细胞数变异度大
(2)分别计算男﹑女两项指标的抽样误差。
见上表最后一栏,标准误计算公式nss
x
/。
(3)试估计该地健康成年男﹑女红细胞数的均数。
健康成年男子红细胞数总体均数95%可信区间为:
X
±1.96Sx=4.66±1.96×0.0306=4.60~4.72(1012/L)
其中n=360故近似按υ=∞。同理健康成年女子红细胞数总体均数95%可信区
间为4.14~4.22(1012/L)
(4)该地健康成年男﹑女间血红蛋白含量有无差别?
Ho:μ
男
=μ
女
H
1
:μ
男
≠μ
女
α=0.05
u=
255/2.10360/2.7/)6.1175.134()/()(22
2121
xxsXX=22.83
按υ=∞,查附表2,得P<0.0005,按α=0.05水准,拒绝Ho,接受H
1
,可
以认为男女间血红蛋白含量不同,男高于女。
2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月
的血沉(mm/小时)如下表,问:
(1)甲,乙两药是否均有效?
(2)甲,乙两药的疗效有无差别?
表3-8甲,乙两药治疗前后的血沉
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
病人号
甲━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
药治疗前19
治疗后693101042533
差值4431036326
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
病人号
乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
药治疗前9110
治疗后6353358274
差值37410512936
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
(1)甲,乙两药是否均有效?
经计算得:
甲药d=3.2000(mm/h)乙药d=5.0000(mm/h)
S
d
=1.9322(mm/h)S
d
=2.9810(mm/h)
S
d
=0.6110(mm/h)S
d
=0.9428(mm/h)
n=10n=10
Ho:μ
d
=0Ho:μ
d
=0
H
1
:μ
d
≠0H
1
:μ
d
≠0
α=0.05α=0.05
t
(甲药)
=d/S
d
=3.2000/0.6110=5.237
t
(乙药)
=d/S
d
=5.0000/0.9428=5.303
=9,查t界值表,得P<0.001,按α=0.05水准,拒绝Ho,接受H1
,故可认为
甲、乙两药均有效。
(2)甲,乙两药的疗效有无差别?
由表中资料分别求得治疗前后差值(见表3-8),再作两组比较。
H
0:
甲乙两药疗效相同
H
1:
甲乙两药疗效不同α=0.05
=18,查t界值表,得0.20>P>0.10,按α=0.05水准,不拒绝Ho,尚不能
认为甲乙两药疗效有差别。
3.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如
下,问两组的平均效价有无差别?
标准株(11人)116
水生株(9人)100
由题知:该资料服从对数正态分布,故得:
标准株水生株
n=11n=9
1lgxX=2.79362lgxX=2.2676
1lgxS
=0.45202lgxS
=0.2355
(1)两组方差齐性检验:
H
0:
2
2
2
1
H
1:
2
2
2
1
=0.05
F=684.32355.0/4520.0/2222
小大
SS
V
1
=10V
2
=8F
0.05(10,8)
=4.30
查附表3,得P>0.05,按α=0.05水准,不拒绝Ho,可以认为两总体方差齐。
(2)两组均数比较;
H
0
两总体几何均数相等
H
1
两总体几何均数不等
α=0.05
查t界值表,得0.01>P>0.005,按α=0.05水准,拒绝Ho,接受H
1
,故可认为钩
端螺旋体病人的血清用标准株和水生株作凝溶试验,前者平均抗体效价高于后者
4.表3-9为抽样调查资料,可做那些统计分析?
表3-9某地健康成人的第一秒肺通气量(FEV1)(L)
FEV
1
人数
男女
2.0~14
2.5~38
3.0~1123
3.5~2733
4.0~3620
4.5~2610
5.0~102
5.5~30
6.0~6.510
合计118100
(1)统计描述。
由上表可见,男性调查118人,第1秒肺通气量分布为2.0~6.5,高峰位于4.0~
4.5组段内,以中间频数分布最多,两侧逐渐减少,左右基本对称,其频数分布可
见上表和下图。女性调查100人,第1秒肺通气量分布为2.0~2.5,高峰位于3.5~
4.0组段内,以中间频数分布最多,两侧逐渐减少,且左右大体对称,频数分布可
见表3-9和图3-1。
图3-1某地健康成人第一秒肺通气量(FEV
1
)(L)分布
由上表和图可见,男性分布范围较宽,右侧尾部面积向外延伸两个组段,高峰
位置高于女性,向右推移一个组段。
(2)计算集中与离散趋势指标,并对两组进行比较。
Ho:男女间第1秒肺通气量总体均数相同
H
1
:男女间第1秒肺通气量总体均数不同
α=0.05
男性:n=118
1
X=4.2373s1
=0.6902
女性:n=100
2
X=3.7250s2
=0.6258
u=
2
2
21
2
1212121
///)(/)(nsnSXXxxsXX
=(4.2373-3.7250)/100/6258.0118/6902.022
=5.624
10
2.02.53.03.54.04.55.05.56.06.5
40
30
0
女男
20
查t界值表,v=∞,得P<0.001,按α=0.05水准,拒绝Ho,接受H
1
,故可认为
男女间第1秒肺通气量均数不同,男高于女。
(3)根据上述分析结果,分别确定95%参考值范围。
男性第1秒肺通气量单侧95%参考范围下限为:
suX
05.0
=4.2373-1.6450.6902=3.16(L)
即可认为有95%的男性第1秒肺通气量不低于3.16(L)
女性第1秒肺通气量单侧95%参考范围下限为:
suX
05.0
=3.7250-1.6450.6258=2.69(L)
即可认为有95%的女性第1秒肺通气量不低于2.69(L)
5.某医师就表3-10资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前,后
(接种后两月)血清抗体(黄疸出血型)的变化。
表3-10328例血清抗体滴度及统计量
抗体滴度的倒数
06401280
X
sxs
免疫前人数29376.1111.76.17
免疫后人数2523411.9470.525.90
t=(411.91-76.1)/2217.69.25=12.6>3,查t界值故P<0.01,说明接种后血
清抗体有增长。试问:
(2)本例属于何种类型设计?
本例属于自身配对设计。
(3)统计处理上是否妥当?
统计处理上不妥当,因为:①在整理资料过程中,未按配对设计整理,而是拆开
对子按成组设计整理,失去原设计的意义。②统计描述指标使用不当,血清浓度
是按倍比稀释,不适合计算算术均数、标准差、因为有零值,也不宜计算几何均数。
对现已整理好的资料,可计算中位数表示平均水平,用四分位数间距表示离散趋势。
③假设检验因本资料不宜计算均数,故对均数进行t检验当然是不妥当的。
6.152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计
和95%区间估计。
滴度倒数282565121024合计
人数2431152
以滴度倒数X的对数值求得X1gx=1.85965,Slgx=0.44245,n=152,则点值
估计G=lg-11.85965=72.39
患儿病后血清抗体滴度倒数总体均数95%可信区间为
lg-1(Xlgx+1.96Slgx/√n)
=lg-1(1.85965+1.96×0.44245/√152)
=lg-1
=61.5~85.11
7.某医院对9例慢性苯中毒患者用中草药抗苯1号治疗:
(1)得表白细胞总数(×109/L),问该药是否对患者的白细胞总数有影响?
表3-119例慢性苯中毒患者治疗前后的白细胞总数
病人号治疗前治疗后d1
16.04.21.8
24.85.4-0.6
35.06.3-1.3
43.43.8-0.4
57.04.42.6
63.84.0-0.2
76.05.90.1
83.58.0-4.5
94.35.0-0.7
H
0
该药对患者的白细胞总数无影响,即μ
d
=0
H
1
该药对患者的白细胞总数有影响,即μ
d
≠0
α=0.05
求得(前—后)差值d
i
经计算得:
d=0.3556S
d
=1.9951n=9
t=
534.0)9/9551.1/(3556.0)//(0nsd
d
=8查附表2,t界值表,得P>0.5,按α=0.05水准,不拒绝Ho,尚
不能认为该药对患者的白细胞总数有影响。
(2)同样得治疗后血小板比治疗前每人平均增加37.8×109/L,并算得
t=4.1,问该药是否对患者的血小板有影响?
H
0
该药对患者的血小板无影响,即μ
d
=0
H
1
该药对患者的血小板有影响,即μ
d
≠0
α=0.05
d=37.8t=4.1
=8
查附表2,t界值表,得0.005>P>0.002,按α=0.05水准,拒绝Ho,
接受H
1
,故可认为该药对患者的血小板有影响,可增加患者血小板。
(3)综合上述结果能否提出进一步研究意见/综合上述结果,提出以下建议:
①在此项研究中,从t检验结果来看,血小板治疗前后变化有意义,
而白细胞则无意义,可补充计算两项指标的95%可信区间,结合专
业知识,分析治疗前后指标差数有无实际意义。
②如有可能扩大样本,追踪观察该药对苯中毒患者的远期疗效
第四章方差分析
答案
填空题
1.各样本是相互独立的随机样本,各样本来自正态总体,
处理组总体方差相等(方差齐性)
2.总变异、组内变异、组间变异SS总=SS组间+SS组内
3.q检验(又称Newman-Keuls法)
4.V总=SS组间+SS组内
是非题:
1.×2.√3.×4.√5.×
单选题:
1.B2.D3.E4.B5.C6.A7.C8.C
计算题:
1.某湖水不同季节氯化物含量测定值如表2-4所示,问不同季节氯化物含量有无差
别?
表4-1:某湖水不同季节氯化物含量(mg/L)
春夏秋冬
22.619.118.919.0
22.822.813.616.9
21.024.517.217.6
16.918.015.114.8
20.015.216.613.1
21.918.414.216.9
21.520.116.716.2
21.221.219.614.8∑
∑Х
ij
167.9159.3131.9129.3588.4
n
i
888832
X20.9919.9116.4916.168.39
∑Х2
ij
3548.513231.952206.272114.1111100.84
S2
i
.52988.55554.50983.47125.0166
(1)多组均数间比较:
表1:方差分析表
变异来源SSvMSF
总变异281.63531
组间变异141.170347.0579.380
组内变异140.465285.017
查F界值表,得P<0.01,按0.05水准,拒绝H0,接受H1,故可认为不同季
节湖水中氯化物含量不同或不全相同。
(2)各组均数间两两比较
H0:μ
A
=μ
B
H1:μ
A
≠μ
B
α=0.05
表2四个样本均数顺序排例
组别春夏秋冬
X20.9919.9116.491
位次1234
表3四组均数两两比较q检验
对比组两均数之差组数q值P值
1与44.8346.099<0.01
1与34.5035.682<0.01
1与21.0821.364>0.05
2与43.7534.735<0.01
2与33.4224.319<0.01
3与40.3320.417>0.05
春与夏、秋与冬湖水中氯化物含量P>0.05,按α=0.05水准不拒绝Ho,即尚不能
认为春与夏、秋与冬季湖水中氯化物含量有差别。除这两对比组外,其它4组均P
<0.01,按α=0.05水准,拒绝Ho,接受H1,即可认为春夏两季湖水中氯化物含
量高于秋冬两季。
2.试就表4-2资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是
否会影响生存日数?
表4-2各组大鼠接种后生存日数
伤寒百日咳对照
568
769
8710
9810
10911
10912
111012
111014
121116∑
∑Хij9284112288
ni10101030
i
X9.28.411.29.6
∑2
ij
X88673213062924
2
i
s4.4002.9335.7334.3553
解Ⅰ:假定生存日数服从正态分布
(1)方差齐性检验:
Ho:三总体方差齐即2
3
2
2
2
1
H
1
:三总体方差不等或不全相等。
α=0.05
)/()1(22kNnss
iic
9(4.4+2.933+5.733)/(30-3)=4.3553
=0.9461
v=2,查附表9,X2界值表,得0.75>P>0.50,按α=0.05水准,不拒绝
Ho,故可认为三组资料总体方差齐。
(2)三组均数比较(表4-5)
Ho:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。
H
1
:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全
相等
α=0.05
C=(∑∑Χ
ij
)2/n=2882/30=2764.8
SS
总
=∑∑Χ
ij
2-C=2924-2764.8=159.2
SS
组间
=∑(∑Χ
ij
)2/ni-C
=[922+842+1122]/10-2764.8
=41.6
SS
组内
=SS
总
-SS
组间
=159.2-41.6=117.6
表4-5方差分析表
变异来源SSvMSF
总变异159.229
组间变异41.6220.84.776
组内变异117.6274.3556
查附表4,得0.05>P>0.01,在α=0.05水准上,拒绝Ho,接受H
1
,故
可以认为大白鼠感染脊髓灰质炎病毒后,在接种伤寒或百日咳菌苗对生存
日数有影响。
(3)均数间多重比较:
Ho:任一组与对照组总体均数相同
H
1
:任一组与对照组总体均数不同
α=0.05
伤寒与对照组比较
=(11.2-9.2)/)10/110/1(3556.4
=2/0.933338
=2.1428
v=27,得0.05>P>0.02,按α=0.05水准,拒绝Ho,接受H
1
,故可认为接
种伤寒菌苗组较对照组生存日数减少。
百日咳与对照组比较
v=27,查附表2,得0.01>P>0.005,按α=0.05水准,拒绝Ho,接受H
1
,
可以认为接种百日咳菌苗组较对照组生存日数减少。
3.研究酵解作用对血糖浓度的影响,从8名健康人中抽取血液并制备了血滤液,没一
个受试者的血滤液又分成4份,再随机地把4份血滤液分别放置0,45,90,135分钟,
然后测定其中血糖浓度(mmol/L)
(1)4组血滤液方差齐性检验:
Ho:不同放置时间血滤液所含血糖浓度总体方差相等,
即2
4
2
3
2
2
2
1
H
1
:不同放置时间血滤液所含血糖浓度总体方差不等或不全相等
α=0.05
方差齐性检验方法同本例X2=1.16847
v=k-1=4-1=3,查附表9,X2界值表,得0.90>P>0.75,按α=0.05水
准,不拒绝Ho,可以认为放置不同时间血滤液所含血糖浓度总体方差齐。
表4-3放置不同时间血滤液所含血糖浓度(mmol/L)
受试者编号放置时间受试者小计
04590135
15.275.274.494.6119.64
25.275.224.884.6620.03
35.885.835.385.0022.09
45.445.385.275.0021.09
55.665.445.384.8821.36
66.226.225.615.2223.27
75.835.725.384.8821.81
85.275.115.004.4419.82
ΣΧ
ij
44.8444.1941.3938.69169.11
n
i
88888
i
X5.60505.52385.17384.83635.2847
∑2
ij
X252.1996245.0671215.0527187.5585899.8779
2
i
s0.12450.13890.13020.06340.1143
(2)配伍组设计方差分析:
处理:Ho:不同放置时间血滤液所含血糖浓度相同
H
1
:不同放置时间血滤液所含血糖浓度不同或不全相同相同
α=0.05
配伍:Ho:8位受试者血液所含血糖浓度相同
H
1
:8位受试者血液所含血糖浓度不同或不全相同
α=0.05
С=(ΣΣⅩ
ij
)2/n=169.112/32=893.6935
SS
总
=ΣΣⅩ
ij
2-С=899.8779-893.6935=6.1844
SS
放置时间
=
CX
bij
2)(
1
=(44.842+44.192+41.392+38.692)/8-893.6935
=2.98524
SS
受试者
=CXk
ij
2)(/1
=1/4(19.642+20.032+22.092+21.092+21.362+23.272
+21.812+19.82)-893.6935
=2.79093
SS
误差
=SS
总
-SS
放置时间
-SS
受试者
=6.1844-2.98524-2.79093=0.40832
方差分析表
变异来源SSvMSF
总变异6.184431
放置时间2.9852430.9950851.189
受试者2.7909370.3987020.510
误差0.40823210.01944
查F界值表F0.05(3,21)=3.07F0.01(3,21)=4.87
F0.05(7,21)=2.49F0.01(7,21)=3.64
放置时间受试者间均P<0.01,按α=0.05水准,均拒绝Ho,接受H
1
,故
可认为不同放置时间、不同受试者间血滤液所含血糖浓度不同或不全相
同。
(3)不同放置时间血滤液所含血糖浓度均数间多重比较,采用多个实验组
与一个对照组均数间两两比较。
①Ho:放置45分钟与0分钟血滤液所含血糖浓度相同
H
1
:放置45分钟与0分钟血滤液所含血糖浓度不同
α=0.05
=0.0812/0.06971=1.16476
v=n-k=32-4=28,查附表2,t界值表,得0.40>P>0.20,按α=0.05
水准,不拒绝Ho,尚不能认为放置45分钟与0分钟血滤液血糖浓度总均
数有差别。
②Ho:放置90分钟与0分钟血滤液所含血糖浓度相同
H
1
:放置90分钟与0分钟血滤液所含血糖浓度不同
α=0.05
=0.4312/0.0697=6.1853
v=28,查附表2,t界值表,得P<0.001,按α=0.05水准,拒绝Ho,
接受H
1
,可认为放置90分钟较0分钟血滤液所含血糖浓度减少。
③Ho:放置135分钟与0分钟血滤液所含血糖浓度相同
H
1
:放置135分钟与0分钟血滤液所含血糖浓度不同
α=0.05
=0.7687/0.0697
=11.0265
v=28,查附表2,t界值表,得P<0.001,按α=0.05水准,拒绝Ho,
接受H
1
,故可认为放置135分钟较0分钟血滤液所含血糖浓度减少。
4.某医师为研究人体肾上腺皮质HSD3(羟基类固醇脱氢酶)活性在四个季节中是
否有差别,采用分光光度计随机测定了部分研究对象,数据见表2.8,请做统计分析.
表4-4四个季节的人体肾上腺皮质HSD3活性
季节nXS
春季420.780.13
夏季400.690.22
秋季320.680.14
冬季360.580.20
解:本题仅给出分析思路及主要结果
1.采用完全随机设计资料的方差分析:
(1)由公式
n
X
X
可推得XnX
由方差公式可推得
)1(
)(
2
2
2
ns
n
X
X
(2)计算SS
总
SS
组间
SS
组内
SS
总
=5.365,SS
组间
=0.777SS
组内
=4.588
列出方差分析表
方差分析表
变异来源SSvMSF
总变异5.365149
组间变异0.77730.25908.248
组内变异4.5881460.0314
(4)确定P值,判断结果
查方差分析表,得P<0.01,在
=0.05水准上,拒绝Ho,接受H
1
,可以认为四个
季节人体肾上腺皮质
HSD3
(羟基类固醇脱氢酶)活性不同或不全相同.
2.进一步作均数间的多重比较分析(略)
第五章相对数
答案
填空题
1.比重和分布,频率与强度
2.率
3.消除混杂因素对结果影响
4.率,构成比,相对比
5.率的抽样误差δx
是非题:
1.√2.×3.√4.×5.√6×.7.×8.×9.×10.×
11.×
单选题:
1.D2.E3.A4.D5.A6.B7.D8.A9.D10.D
11.B12.E13.A14.C15.E16E.17.E18.B19.A20.A
21.C22.D
计算题:
1.表5-1(1)~(4)栏资料宜计算那些相对数指标?试对围产儿在围产期死亡的主
要因素作初步分析。
表5-1不同体重,孕周,产次的围产儿死亡情况分析
因素分组出生数死亡数死亡构成比(%)死亡率(%)
(1)(2)(3)(4)(5)(6)
体重(g)1000~1.18119.91
2500~6.835.84
4000~5373481.998.93
合计2.0011.54
孕周(周)<38.55113.32
38~3.469.32
42~140132445.9917.41
合计2221284075100.0018.35
产次(次)62.8014.55
25159673923.9214.32
372562598.3835.69
41786822.6545.91
≥5954692.2372.33
合计00.0015.85
先就上述资料计算了上表(5)~(6)栏两类指标。
由表中死亡率可知;体重低于2500g组围产儿死亡率约为2500g组的20倍;孕
周<38周组围产儿死亡率约为38周组的12倍;随着产妇的产次增加,围产儿死
亡率也逐渐升高。
由表中死亡构成比可知:半数以上的围产儿死亡率集中在体重1000~2500g组和
孕周<38周组。为降低围产儿死亡率,对体重偏低,不足月妊儿及多产次产妇应
加强产前保护。
2.表5-2为一抽样研究资料
(1)填补空白数据,见下表()内。
表5-2某地各年龄组恶性肿瘤死亡情况
年龄人口数死亡总数其中恶性恶性肿瘤死亡恶性肿瘤死年龄别死
(岁)肿瘤死亡数占总死亡的(%)亡率(1/10万)亡率(%0)
(1)(2)(3)(4)(5)=(4)/(3)6)=(4)/(2)(7)
0~82920(138)42.90(4.82)(1.644)
20~(46638)63(12)19.0525.73(1.351)
40~2816117242(24.42)(149.142)(6.108)
60~(9371)(342)32(9.63)(341.479)(36.496)
合计167.59(53.863)(4.279)
(2)根据最后(5)(6)(7)三栏结果作简要分析
由表中第(5)栏可知:40~岁组恶性肿瘤死亡占总死亡比重最高,近1/4;20~
岁组次之,占19.5%;60~岁组恶性肿瘤死亡人数最多,但仅占9.36%;0~岁组恶性
肿瘤死亡占总死亡比重最底,仅占2.90%由表中第(6)栏可知:恶性肿瘤的年龄别死
亡随年龄的增大而增加,以60~岁组为最高,为341.479/10万。故可认为恶性肿瘤对
老年人危害最大,应引起足够的重视。由表中第(7)栏可知:年龄别死亡率以40岁
以下最低,以后随年龄的增加而增加,60岁以后高达36.496‰。
(3)试估计“0~”岁年龄组恶性肿瘤死亡率和年龄别死亡率的可信区间。
0~岁组恶性肿瘤死亡率的可信区间:死亡数为4,查poisson分布u的可信区间,
可信区间为1.0~10.2。所以恶性肿瘤死亡率的95%可信区间为:
(1.0/82920~10.2/82920)=(1.206~12.301)/10万
0~岁组年龄别死亡率的可信区间,按式:
(4)试比较“20~”与“40~”岁组恶性肿瘤死亡率有无差别。
Ho:20~与40~岁组恶性肿瘤死亡率相等,即π
1
=π
2
H
1
:20~与40~岁组恶性肿瘤死亡率不相等,即π
1
≠π
2
α=0.05
本例:n
1
=28161x
1
=42n
1
-x
1
=28119
n
2
=46638x
2
=12n
2
-x
2
=46626
合计:747995474745
X2=37.07
查X2界值表,得P<0.005在α=0.05的水准上,拒绝Ho,接受H
1
,故可认为20~岁
组与40~岁组恶性肿瘤死亡率有差别。
3.试就表5-3资料分析比较甲乙两医院乳腺癌病人手术后的五年生存率。
表5-3甲乙两医院乳腺癌病人手术后五年生存率
标化(甲+乙医院合计为标准)
腋下淋巴标准病甲医院乙医院
结转移例数原生存率(%)预期生存人数原生存率(%)预期生存人数
NiPiNiPiPiNiPi
(1)(2)(3)(4)=(2)(3)(5)(6)=(2)(5)
无34577.77268.3171.67247.26
有79363.38502.6050.60401.26
合计1138(∑Ni)64.24770.91(∑NiPi)67.10648.52
甲医院乳腺癌手术后五年标化生存率
N
N
ii
'×100%=
1138
91.770
×100%=67.74%
乙医院乳腺癌手术后五年标化生存率
N
N
ii
'×100%=
1138
52.648
×100%=56.99%
因为甲乙两医院有无腋下淋巴结转移的病型构成不同,故标化后,甲医院乳腺癌
手术后五年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。
2.为了解某乡钩虫感染情况,随机抽查男200人,感染40人,女150人,感染20人。
(1)该乡男性感染率是否高于女性?
Ho:男女性的钩虫感染率相同,即π
男
=π
女
H
1
:男性的钩虫感染率高于女性,即π
男
>π
女
单侧α=0.05
P
1
=40/200=0.2P
2
=20/150=0.1333
P
C
=(X
1
+X
2
)/(n
1
+n
2
)=60/350=0.1714
u=
)n/1n/1)(P1(P
PP
21CC
21
=
6385.1
)150/1200/1)(1714.01(1714.0(
1333.02.0
查t界值表,υ=∞,得单侧0.10>P>0.05,按α=0.05水准,不拒绝Ho,尚不
能认为该乡男性钩虫感染率高于女性。
(2)若对该乡居民作驱钩虫治疗,需要按多少人准备药物(全乡人口男7253人,女
7109人)?
计算该乡钩虫感染率的95%可信区间:
=(13.19~21.09)%
14362×13.19%=1894(人)14362×21.09%=3029(人)至少需要按1894人,
最多按3029人准备药物。
3.抽样调查某企业2839名职工高血压病,结果见表.据此,某医生认为:①该企业高血
压发病率为8%,并随年龄递增,其中40岁以上患者占全部病例的90.3%,60岁以
上者发病率为100%。②高血压发病与性别有关,男性为10.2%,女性为4.5%,男
性明显高于女性(P<0.01)。以上分析是否妥当,试加评述。
表5-4男、女年龄组高血压病例分布
男性女性
年龄组——————————————————————————————
受检人数病例数发病率(%)受检人数病例数发病率(%)
20~33351.571240.6
30~30141.314296.3
40~5176412.41852714.6
50~5769316.061914.8
60~1212100.0
合计173917810.21100494.5
答:该分析不正确。因为:
(1)高血压患病率为8%,而不是发病率。原文中60岁以上的发病率是100%,应
为患病率,且由于60岁以上受检人数太少,不宜计算相对数。
(2)由于男女性受检人数的年龄构成不同,不能直接比较两总患病率,对男女合
计进行假设检验更无意义。由于各年龄组患病率出现明显交叉,如:20~和
50~岁组的男性患病率均高于女性,而30~和40~岁组的男性患病率均低
于女性。此资料宜直接比较各年龄组的患病率,而不宜使用标准化。
4.某产院拟分析畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,畸形儿116
例,得以下资料。据此得出结论:“母亲年龄在24~29岁时,畸形儿最多,占总数
的92.2%,符合一般规律”。
母亲年龄(岁)2282930313233合计
畸形儿例数9133111116
%0.861.712.116.420.715.516.411.22.60.860.860.86100.00
(1)以上结论是否合理?为什么?以上结论不合理,不能以比代率。
(2)若要达到作者之目的,应计算什么相对数指标较好?如何计算?
若要达到作者的目的,应计算产妇年龄别畸形儿发生率。
某年龄(组)畸形儿发生率=
%100
死胎数死产该年龄组活产
胎婴儿数某年龄组先天性畸形的
7.某市1971~1981年乙型脑炎发病率如表5-5,试作动态分析
表5-5某市1971~1981年乙型脑炎发病率动态分析
年份发病率绝对增长量发展速度(%)增长速度(%)
(1/10万)累计逐年定基比环比定基比环比
197120.52——100100——
19726.31-14.21-14.2130.7530.75-69.25-69.25
19731.87-18.56-4.449.1129.64-90.89-70.36
19743.07-17.451.2014.96164.17-85.0464.17
19751.08-19.44-1.995.2635.18-94.74-64.82
19761.38-19.140.306.73127.78-93.2727.78
19772.29-18.230.9111.16165.94-88.8465.94
19782.31-18.210.0211.26100.87-88.740.87
19792.47-18.050.1612.04106.93-87.966.93
19802.76-17.760.2913.45111.74-86.5511.74
19812.94-17.580.1814.33106.52-85.676.52
本资料从1971年到1974年,发病率呈下降趋势,1975年开始呈上升趋势,
故以1975年为基期计算。
平均发展速度=%2.11808.1/94.26
平均增长速度=平均发展速度-1=1.182-1=18.2%
动态分析:从绝对增长量看,各年乙型脑炎发病率均低于1971年,10年内
共降低17.58/10万。总的来看发病率呈下降趋势,但降低的速度是不平衡的;
从发展速度和增长速度来看,在最初的1971~1975年是基本下降的,以后又略
有回升现象。在1975年至1981年期间发病率平均发展速度为118.2%,平均增长
速度为18.2%。
8.从表5-6资料,判断某工厂肺癌发生率是否比一般人群高?
表5-6某工厂肺癌发生率
分组某厂一般人群
人数肺癌人数肺癌发生率(1/万)
吸烟70054.5
不吸烟30011.5
Ho:μ=μo
H
1
:μ>μo
单侧α=0.05
μo吸烟=n
1
π
1
=700×0.00045=0.315
μo不吸烟=n
2
π
2
=300×0.00015=0.045
吸烟者的肺癌发生人数X≥5累计概率:
P=1-[p(0)+p(1)+p(2)+p(3)+p(4)]
P(0)=e-μ=e-0.315=0.7298
P(1)=P(0+1)=P(0)×μ/(0+1)=0.7298×0.315/1=0.2299
P(2)=P(1+1)=P(1)×μ/(1+1)=0.2299×0.315/2=0.0362
P(3)=P(2+1)=P(2)×μ/(2+1)=0.0362×0.315/3=0.0038
P(4)=P(3+1)=P(3)×μ/(3+1)=0.7298×0.315/4=0.000299
P=1-(0.7298+0.2299+0.0362+0.0038+0.000299)=0.000001,按α=0.05水准
拒绝Ho,接受H
1
,故可认为某工厂吸烟的肺癌发生率明显高于一般人群
不吸烟组:Ho:μ=μo
H
1
:μ>μo
单侧α=0.05
不吸烟者的肺癌发生人数X≥1的累计概率:
P=1-P(0)
P(0)=e=e-0.045=0.956
P=1—0.956=0.044,按α=0.05水准拒绝Ho,接受H
1
,故可认为某工厂不吸烟的
肺癌发生率高于一般人群。
9.就表5-7资料如何比较甲乙两厂某工种某病患病率
表5-7甲,乙两厂某工种某病患病率
工龄甲厂乙厂
(岁)工人数患者患病率(%)工人数患者患病率(%)
<3400123.0010011.00
≥31001010.004007218.00
合计500224.405007314.60
从表中可以清楚看到≥3的工龄组的患病率乙厂高于甲厂,<3岁组甲厂高于乙厂,
呈现交叉现象。甲厂以患病率低的3年以下工人为主,乙厂则以患病率高的工龄
在3年以上的工人为主。这种情况下不能直接比较总患病率,应按不同工龄组进
行比较
10.设某病患者的自然康复率为30%,分别求10个患者中自然康复1人及以下,8人以
上的概率
本例π=0.30,1-π=0.7,n=10。依题意10名患者中:
(1)康复1人及以下的概率
P(X≤1)=)1()0()(
1
0
PPXP
P(0)=0.710=0.02825
P(1)=12106.03.07.0
)!110(!1
10
)110(
!
P(x≤1)=0.02825+0.12106=0.1493
(2)康复8人及以上的概率。
P(x≥8)=)10(10)9()8()(
10
8
ppXp
P(8)=xxn
n
xX)()1)((
=0014467.03.07.0
)!810(!8
!10
8)810(
P(x+1)=P(X)×
11X
Kn
P(9)=p(8)
0001378.0
3.01
3.0
18
810
P(10)=0.310=0.000005905
则P(x≥8)=P(8)+P(9)+P(10)=0.00159
当某病自然康复率为30%时,10名患者中1人及1人以下康复的概率为0.14931,
康复8人及8人以上的概率为0.00159
11.用某型麻疹疫苗接种一批麻疹易感儿,把接种后已阳转者96名作为观察对象,3
年后复查,96名中仍为阳性者为85名,试求该疫苗接种阳转者3年后仍保持阳性
的百分率的95%可信区间
因为nP=85,nq=11,均大于5,n=96>50,可按正态近似求该疫苗接种3年仍
保持阳转率的95%可信区间。
=0.85540.0637=(82.17~94.91)%
12.用一种新药治疗某种寄生虫病,受试者50人中在服药后1人发生严重反应,这种
反应在此病患者中也曾有发生,但过去普查结果为每5000人仅有一人出现。问
此药是否提高了这种反应生率?
Ho:服药后的反应率与普查时的反应率相等,即受试者每50人服药后平均反应人
数为μo
H
1
:服药后的反应率高于普查时的反应率,即μ>μo
单侧α=0.05
本例n=50,πo=1/5000=0.0002,μo=nπo=50×0.0002=0.01,样本例数为50时,
抽得样本严重反应人数X≥1的概率:
P=1-P(0)P(0)=99.001.0ee
P=1-0.99=0.01
今P=0.01,按α=0.05,拒绝Ho,接受H
1
,故可认为此新药能提高了这种反应的
发生率。
13.同一水样中,每次抽取1ml置培养皿中,共作10个平板培养,共数得菌落146个,
试估计该检样菌落数的95%可信区间。
X=146(个),X>50,用正态近似法求该检样本菌落数的95%的可信区间为:
X±)(68.169~32.12214696.1146Xu
a
个
14.某疫苗预防接种后,进行有关的非传染性疾病流行病学考核,结果如下:接种组
与对照组各调查10万人,接种组发病22人,对照组发病36人。试问两组发病
率有无差别?
Ho:两组发病率相同,即μ
1
=μ
2
H
1
:两组发病率不相同,即μ
1
≠μ
2
α=0.05
本例人36
1
2
=22人
u=
8383.1
3622
2236
21
21
查附表2,t界值表,υ=∞,得0.1>P>0.05,在α=0.05的水准上,不拒绝
Ho,尚不能认为两组发病率有差别。
15.甲乙两市分别用抽样调查了解已婚妇女宫颈癌的患病情况,甲市调查1万人,患者
82例,乙市调查2万人,患者102例。问甲乙两市宫颈癌患病率有无差别?
Ho:两市已婚妇女宫颈癌患病率相等,即μ
1
=μ
2
H
1
:两市已婚妇女宫颈癌患病率不相等,即μ
1
≠μ
2
α=0.05
1
X=82/10000=0.0082,
2
X=102/20000=0.0051
u=
20000/0051.010000/0082.0
0051.00082.0
//
2211
21
nXnX
XX
=2.9899
本题也可以万人为单位,计算更为简单:
u=9899.2
2/5182
5182
查附表2,t界值表,υ=∞,得0.005>P>0.002,在α=0.05的水准上,拒绝Ho,
接受H
1
,故可认为两市妇女子宫颈癌患病率的差别有显着性,甲市已婚妇女子宫
颈癌患病率高于乙市。
16.观察某种防治细菌性痢疾(菌痢)措施的效果,结果如表3-6。问能否据此认为该
措施有效?
表5-8两组人群菌痢发病率的比较(1979年)
分组人数菌痢例数(无菌痢数)发病率(‰)
试验组41182140975.1
对照组521772514513.8
合计93359392429.96
Ho:π
1
=π
2
H
1
:π
1
≠π
2
单侧α=0.05
u=
)/1/1)(1(
21
21
nnPP
PP
CC
=
204.4
)5217/14118/1)(00996.01(00996.0
0138.00051.0
查附表2,t界值表,υ=∞,得P<0.005,按α=0.05的水准,拒绝Ho,接受H
1
,
故可认为实验组和对照组的菌痢发病率有差别,实验组的发病率低于对照组,即该
措施有效。
17.把某肿瘤新发病例按住址点在一张地图上,又将地图划分成许多面积相等的小方
格,再分别统计发病数0,1,2,……及相应的方格数,对此资料作Possion分布
拟合优度的X2检验,若P<0.05,就可认为此病在人群中的分布不随机,可能有
聚集性。你认为如何?
答:对此资料作Poisson分布拟合优度的X2检验,若P<0.05按α=0.05水准,
拒绝Ho,接受H
1
,可认为此资料不服从Poisson分布,也即可以认为此病在人群
中不呈随机分布,再综合考虑环境(地形、地貌)遗传等资料,结合专业知识确
定有无聚集性。
18.某乡有人口5000人,已知血吸虫粪检阳性率下降至5%左右。血防站准备进行一次
血吸虫感染的普查,拟先将每10人粪便作为一个初筛的混合样本,混合样本血吸
虫卵阴性,则该10人均作阴性;混合样本阳性,再对该混合样本的10人粪便逐
人复查。问此法比一般的逐人粪便检查会减少多大的工作量?
设:k=每组混合样本例数;P=粪检血吸虫卵阳性率;q=阴性率=1-p;
N=全部受检人数;N/k=混合样本数,即组数
(1)计算每组平均检验次数。
由二项分布理论可知:
概率检验次数
混合样本内粪检q.q.q…q=qk1
全部为阴性
混合样本内粪检1-qkk+1
至少有1例阳性
一组平均检验次数=(qk×1)+(1-qk)(k+1)=k-kqk+1(1)
(2)计算全部检验期望数。
全部检验期望数=(N/k)(k-kqk+1)=N(1-qk+1/k)(2)
本例已知:N=5000,K=10,P=0.05,q=1-p=0.95,代入试(2)
全部受检期望数=5000×(1-0.9510+1/10)=2506.32
比一般逐人检查减少工作量:5000-2506.32=2493.68,减少工作量的百分比为:
2493.68/5000=49.87%。
19.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,
将全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果
如表5-9,试估计该县百白破疫苗接种率的95%可信区间。
表5-9某县三类乡百白破疫苗接种率调查结果
类别人数抽样人数接种率
好73717230.8174
较好1489914780.6969
差93089300.3022
合计305783131
本题为求按比例分配的分层抽样中总体率的可信区间,首先计算接种率及
其标准误。
(1)p=[ΣΝ
i
Ρ
i
]/Ν=1/31578[7371×0.8174+14899×06969+9308×0.3022]
=19221.0461/31578=0.608685
(2)NnppNnNs
iiiiip
/)1/()1()[(/1(2
=)}1930/(6978.03022.0)[9308/9301(
2
9308)]1723/(1826.08174.0)[7371/7231(
2
7371
=0.007520
该率不接近于0或1,一般认为服从二项分布。因n=3131,较大,可用
正态近似法计算其可信区间。
95%CI:P±1.96sp=0.608635+1.96×0.007520=(0.5939,0.6234)
20.为了解某县某病感染率,现从全县125个村民组(共3万人)中随机抽出10个村
民组,对该10个村民组的全部人口进行了调查,结果如下,试据此估计此县农村
居民感染率
村民组合计
人数493503702386
感染人数497
本例采用整群抽样作总体率的点估计和区间估计。
按正态近似原理计算:已知:K=125,k=10
点估计:p=(K/Nk)(Σα
i
)
=(125/30000/10)×(797)=0.3321
=0.03355
95%?可信区间:P±1.96sp=(0.2663,0.3979)
99%可信区间:P±2.58sp=(0.2455,0.4187)
第六章χ2检验
1.合理并组
2.确切概率法(精确X2.0)
3.n≥401≤T<5
是非题:
1.√2.√3.×4.×5.×6.√7.√
单选题:
1.A2.A3.B4.D5.A6.E7.C8.E9.A10.B
11.D12.D13.B14.A15.E16.C17.D18.C19.A20.A
21.E
问答题:
1.X2检验适用于解决那些问题?对资料的设计类型和应用条件有何不同要求?
(1)X2检验适用于:①两个及两个以上的率或构成比的比较;②计数资料
两因素间的相关关系;③频数分布的拟合优度检验。
(2)对资料的设计类型和应用条件。
1)四格表的X2检验:
基本公式
T
TA
X
2
2
)(
T>5且n>40
专用公式
))()()((
)(2
2
dbcadcba
nbcad
X
校正公式
))()()((
)2/(2
2
dbcadcba
nnbcad
X
1<T<5且n>40
或
T
TA
X
2
2
)5.0(
当T<1或n<40时,可使用确切概率计算法直接计算概率,应用时注意区分单、
双侧检验。双侧检验。双侧检验取两侧累积概率,单侧检验只取一侧累积概率。
2)行×列(R×C)表资料的X2检验:
基本公式与四格表基本公式相同。
专用公式:
)1(
2
2
CR
nn
A
nX
可使用实际频数计算X2。
适用条件①行×列表不宜有1/5以上的格子的理论频数小于5,或有一格理
论频数小于1。②当多个样本率(或构成比)比较的X2检验,拒绝检验假设,
只能认为各总体率(或构成比)之间总的有差别,但不能说明彼此间都有差别
或某两者间有差别,若要进一步解决此问题,可用X2分割法。③对单向有序
列
联表,X2检验只说明各处理组的效应在构成比上有无差别。
3)列联表资料的X2检验:
R×C列联表公式:与R×C(行×列)表相同,但检验假设不同,R×C
列联表用于检验有无关联,而R×C(行×列)表用于多个率或构成比的比较。
适用条件与行×列表适用条件①相同。
2×2列联表或配对资料X2检验,检验两个处理有无差别。
cb
cb
X
2
2
)(
b+c>40
或校正公式
cb
cb
X
2
2
)1(
b+c<40
检验两种处理间有无相关,公式同四格表所用公式
4)频数分布拟合优度的X2公式
T
TA
X
2
2
)(
适用条件遇有理论频数小于5时,可与相邻组合并。
2.X2检验的基本思想是什么?
X2检验的基本思想是实际数与理论编数的吻合程度,它是根据检验假设来确定的,
如作两样本率的比较,我们先假设两组的总体率相同,均等于两组合计的总率,如
果检验假设成立,则实际数与理论数之差一般不会很大。出现很大的X2值的概率是
很小的若PX则没有理由
拒绝它
3、四表格资料在何种情况下需要进行校正?为什么?
在1≤T<5n≥40时,需要计算校正X2
推断统计量X2时是用一种连续概率分布(X2分布)作为对观测频数概率分布的近似,
为改善此近似提出了一个修正,即取平方之前将正偏差(A-T)减0.5,负
偏差加0.5,这样使X2值降低,校正后的概率更接近确切的概率。
4、行X列表X2检验的注意事项有哪些?
(1)X2检验要求理论数不宜太小,否则将导致分析的偏性,一般认为行X列表中不宜
有1/5以上格子的理论频数小于5,或有一个理论数小于1。
对理论数频数大小有三种处理方法:
①最好增加样本例数以增加理论频数
②删去上述理论频数太小的行或列
③将太小理论频数所在行或列与性质相近的邻行邻列的实际频数合并。
后两法可能会损失信息,也会损失样本的随机性,不同的合并方式有可能影响推断
结论,故不宜作常规方法。
(2)当多个样本率(或构成比)比较的X2检验,结论为拒绝检验假设,只能认为各总
体率(或总体构成比)之间总的来说有差别,但不能说明它们彼此见都有差别,或
某两个间有差别,实际工作中,常常还需要知道各组间比较的情况,若要进一步解
决此问题,不能采用一般四格表的X2检验进行两两比较,因为这会增大犯Ⅰ型错误
的概率,可采用以下方法:
①改变显着水准后的两两比较法(Brunden法)
前已述及,若将多个样本两两构成四格表,用一般的四格表方法会增大Ⅰ型错误,
那么,一种自然的想法就是能否将显着水准适当降低,从而一方面相当于抵消Ⅰ型
误差的增加,一方面又可采用一般的四格表方法处理?改变显着性水准的方法正是
基于这种思想。Brunden法系将检验水准α调整为α
α’=α/2(K-1)(9.10)
式中K为样本数,然后用求得的各四格表的X2值与X2α值比较,从而作出推断,也
就是说,若取α=0.05,K=6(则α’=0.005),则不能用X2
0.05(1)
=3.84为界值,而要
用X2
0.05(1)
=7.88为界值。此外,也可用各四X2检验对应的P值与α’比较而得出结
论。
②改变显着界值的两两比较法:
该法类似于上法,但考虑到了处理组数a,因而更合理,处理组数a是各组按率的
大小排列后,欲比较的两组间包括的组数,表9.1列出了用蒙特卡洛模拟法求出K×2
表分割为非独立的四格表的显着界值。有了此显着界值后,只要用各四格表的X2值
与相应的界值相比即可作出结论。
K×2表分割为非独立的四格表的显着界值
K处理a
23456
33.105.48
5.158.48
43.004.486.48
4.786.539.33
53.053.995.237.23
4.405.707.359.88
63.033.944.706.158.05
4.505.406.558.4510.00
计算题:
1.某医师用甲、乙两药治疗某病,结果如下表,问甲、乙两药疗效有无差别?
表6-7甲、乙两药疗效比较计算表
药物治愈数未治愈数合计
甲291140
乙69473
合计9815113
Ho:两药疗效相同,即π
1
=π
2
H
1
:π
1
≠π
2
α=0.05
T
min
=15×40/113=5.31且n>40用公式
))()()((
)(2
2dbcadcba
nbcad
X
=10.88
查X2界值表,得P<0.01,按α=0.05的水准拒绝Ho,接受H
1
,故可认为甲、乙
两药疗效有差别,乙药疗效较好。
2.某卫生防疫站在中小学观察三种矫治近视眼措施的效果,近期疗效数据如表,结论
为“近期疗效要以夏天无眼药水最好,保健操为次,新医疗法最差”。试对此作分
析评价。
表6-2三措施的近期有效率比较
矫治方法有效人数无效人数(合计)有效率(%)
夏天无眼药水518413537.78
新医疗法6263218.75
眼保健操5131827.78
合计6212318533.51
Ho:三组药物近期有效率相等
H
1
:三组药物近期有效率不等或不全相等
α=0.05
+498.4)1
12318
13
6218
522
v=(2-1)(3-1)=2查X2界值表,得0.25>P>0.1,按α=0.05的水准不拒绝Ho,
尚不能认为三种措施的近期有效率有差别。
3.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料整理如表。问两者之
间是否存在一定的关系?
表6-3某厂职工冠心病与眼底动脉硬化普查结果分析
眼底动脉硬化冠心病诊断结果合计
正常可疑冠心病
Ⅰ7313692
Ⅱ+Ⅲ1002019139
合计5134431588
注:原表中
3,4
T=6×31/588=0.3163<1,故将Ⅱ和Ⅲ级合并
(1)解法Ⅰ:本题为双向有序分类变量,可设X为眼底动脉硬化等级,Y为冠心病诊
断结果,X、Y的等级分别为1、2、3。计算Spearman等级相关系数r
s
=0.2988,
P<0.05,眼底动脉硬化程度与冠心病诊断结果存在正相关。
(2)解法Ⅱ:列联表X2检验
Ho:冠心病与眼底动脉硬化级别无关
H
1
:冠心病与眼底动脉硬化级别有关
α=0.05
31139
19
44139
20
513139
100
3192
6
4492
13
51392
73222222
-1=58.134
查附表9,X2界值表,得P<0.005,按α=0.05的水准拒绝Ho,接受H
1
,故可认
为该厂职工冠心病与眼底动脉硬化级别有关。
4.表6-4用两种方法检查已确诊的乳腺癌患者120名。甲法检出率为60%,乙法检出
率50%,甲乙两法一致的检出率为35%,问:
(1)两种方法何者为优?
表6-4甲乙两法检验结果
乙法甲法合计
+-
+421860
-303060
合计7248120
Ho:两法分不出优劣,即B=C
H
1
:两法能分出优劣,即B≠C
α=0.05
b+c=18+30=48>40
v=1,查附表9,X2界值表,得0.10>P>0.05,按α=0.05的水准不拒绝Ho,尚
不能认为检出率有差别
(2)两种方法的检出结果是否有关系
Ho:两法的检出结果无关系
H
1
:两法的检出结果有关系
α=0.05
24120/4860
min2,1
Tn>40用公式
=
00.5
48726060
120)30183042(2
查X2界值表,得0.05>P>0.01,按α=0.05的水准拒绝Ho,接受H
1
,故可认为
甲、乙两法检出结果有关。
4.经反复多次实践证明,用一般疗法治疗某病的治愈率约为20%。现改用新疗法治疗,
并随机抽取400名该病患者进行治疗,那么这400名患者中至少要多少人治愈才能
判断比一般疗法效果好?此判断发生错误的概率有多大?
Ho:两种疗效法治愈率相同,即
2.0
H
1
:2.0
单侧α=0.05
本例n=4002.0
u=
n
p
/)1(
00
0
解之,nup/)1(
000
=0.2+1.645400/)2.01(2.0=0.2329
X=Np=4000.2329=94(人)
400名患者中至少要有94人治愈才能判断新疗法比一般疗法效果好。此判断可能
发生错误的概率为5%
5.某种化学物质经诱发肿瘤试验,实验组15只白鼠中4只发生癌变,对照组10只白
鼠无一发生癌变(表6-5)。问两组发癌率有无差别?
表6-5某药物肿瘤治疗试验
发癌数未发癌数合计
实验组41115
对照组0(1.6)1010
合计42125
Ho:两组发癌率相等,即π
1
=π
2
H
1
:两组发癌率不等,即π
1
≠π
2
α=0.05
本题n=25<40,故用四格表的确切概率法公式:
P=
!!!!!
)!()!()!()!(
ndcba
dbcadcba
周边合计保持不变的四格表有(1)~(5):
取︳A-T︳大于等于1.6表的概率和,即P=p(1)+p(5)=0.1076+0.0166=0.1242,
按α=0.05水准不拒绝Ho,尚不能认为两组的发癌率有差别。
6.某医院收治了100例临床确诊的小儿佝偻病患者,入院时均分别作血生化检查与X
光片检查(表6-6)。欲了解此病法何者较敏感,试设计一整理表,并指出宜作何
统计处理?
应做配对设计表6-6佝偻病患儿入院检查登记表
编号生化检验X光片
1
2
.
.
100
每个患儿按检查顺序编号,生化指标及X光片阳性记为“+”,阴性记为“-”,根
据表6-6登记结果,整理归纳记入表6-9。
表6-9生化检查和X线检查结果
生化X线检查合计
检查+-
+αbα+b
-cdc+d
合计a+cb+dN
若在考虑了两法一致的a,d以后,仍拟比较两法何者较敏感,应做配对资料的X2检验.
)(
)(2
2
cb
cb
X
(b+c>40)
)(
)1(2
2
cb
cb
X
(b+c<40)v=1
8.某医生观察某新药对预防流行性感冒(流感)的效果,并作了统计处理(表3-18),你
对此有何意见
表6-7用药组和对照组流感患病率比较
发病数未发病数合计有效率%
服药组5013018072.2
未服药组4019023082.6
合计9032041078.05
X2=6.63,P<0.05
(1)因旨在观察新药的效果,根据服药组有效率低于对照组(未服药)就不必进行
假设检验。
(2)应对本项实验观察的易感者暴露条件进行分析是否均衡可比。
第七章秩和检验
答案
填空题
1.非参数统计(秩和检验)
2.不受总体分布的限定,适应范围广,检验效率低于参数检验
3.P<0.054.n>25
是非题:
1.√2.√3.×4.√
单选题:
1.A2.D3.C4.D5.B6.B7.E8.E9.A10.D
11.C12.B
问答题:
1.参数检验与非参数检验的区别何在?各有何优缺点?
(1)参数检验与非参数检验的区别。
1)参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。
2)非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。
(2)参数检验与非参数检验的优缺点。
1)参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等
级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布型已知
和总体方差相等。
2)非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条
件的资料用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非
参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,
如需检验出同样大小的差异的差异往往需要较多的资料。另一点是非参数检验
统计量是近似服从某一部分,检验的界值表也是有近似的(如配对秩和检验)
因此其结果有一定近似性。
2.非参数检验适用那些情况?
(1)等级顺序资料。
(2)偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换,或虽经变量变
换但仍未达到正态或近似正态分布时,宜用非参数检验。
(3)未知分布型资料
(4)要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。
(5)初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步
分析,挑选其中有意义者再进一步分析(包括参数统计内容)
(6)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作
出估计,在这种情况下可用非参数统计方法。
3.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一
组的相同数据不必计算“平均秩次?
因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组
内,出现相同数据不编平均秩次,该组秩和不受影响。
4.两样本比较的秩和检验当n
1
>10,n
2
-n
1
>10时采用u检验,这时检验是属于参数
检验还是非参数检验,为什么?
两组比较的秩和检验,当n大时,秩和分布近似正态分布,此时不必要再编制比n
更大的T检验界值表,而利用秩和分布随n增大渐近正态分布的性质,进行u检验,
故仍属于非参数检。
计算题:
1.试检验(表7-1)针刺不同穴位的镇痛效果有无差别?
(1)假设:Ho:三穴位镇痛效果的分布相同
H
1
:三穴位镇痛效果的不同或不全相同α=0.05
(2)计算检验统计量:
表7-1针刺不同穴位的镇痛效果
镇痛效果各穴位的观察频数秩次范围平均秩次
合谷足三里扶突合计
+3853471381~13869.5
++44292396139~234186.3
+++~293264.0
++++24163373294~366360.0
R
i
2462
n
i
6
R
i
185.89172.73192.31
H=12/[N(N+1)]×2
i
R/ni
-3(N+1)
=12/[366(366+1)×[219352/118+217642/126+234622/122]-3(366+1)
=2.212
C=1-Σ(3
i
t-ti
)/(N3-N)
=1-[(1383-138)+(963-96)+(953-95)+(733-73)]/(3663-366)
=1-0.0838=0.9162
H
C
=2.212/0.9162=2.414
(3)确定P值和作出推断结论:本题K=3,v=3-1=2,查附表9,X2界值表,得0.05
>P>0.25,按α=0.05水准,未拒绝Ho,尚不能认为三种穴位镇痛效果有差别。
2.某实验分别用两种方法对36件样品测定大肠菌指数,得表4-9资料,作t检验
(t=1.546,P>0.05),认为两法结果一致,你对此有何意见?
表7-2用两法测定36件水源水样品的结果
大肠菌指数DY-2法(样品数)发酵法(样品数)
95001
230063
940030
23000245
23800327
合计3636
均数18493.3321262.5
本实验数据应用t检验,存在下列问题:
(1)本实验属于配对设计,但整理成频数表已拆开原样本的对子,成为两组比较的
形式。
(2)频数分布呈极度偏态分布,不宜使用t检验
(3)应使用配对设计差值的符号秩和检验。
3.表7-3资料是12名宇航员航行前及返航后24小时的心率(次/分),问航行对心率
有无影响?
(1)假设:Ho:差值总体中位数Md=0
H
1
:差值总体中位数Md≠0α=0.05
(2)求检验统计量:
表7-3宇航前后24小时心率(次/分)
宇航员号航行前航行后差值秩次
(1)(2)(3)(4)(5)
17693-17-9
2716831
3706554
46165-4-3
58093-13-8
65978-19-11
77483-9-7
86279-17-10
97998-1912
107278-6-5
118490-6-6
12636032
T
+
=7T
-
=71
(3)确定P值和作出推断结论:任取T
+
=7或T
-
=71,查附表10,T界值
表,得P<0.01,在α=0.05水准上,拒绝Ho,接受H
1
,可以认为航行
对心率有影响。
4.配对比较两种方法治疗扁平足效果,记录如表7-4,问那种方法好?
(1)假设:Ho:两法疗效差值中位数Md=0
H
1
:Md≠0
α=0.05(2)求检验统计量:
表7-4甲乙两法治疗扁平足疗效比较
病例号甲法乙法差数秩次
(1)(2)(3)(4)=(2)-(3)(5)
1好1差3-2-9
2好1好10-
3好1差3-2-10
4好1中2-1-4.5
5差3中214.5
6中2差3-1-4.5
7好1中2-1-4
8好1差3-2-11
9中2中20-
10差3差30-
11好1中20-
12差3差30-
13好1中2-1-4.5
14中2差3-1-4.5
15好1中2-1-4.5
16中2差3-1-4.5
*1:好2:中3:差T
+
=4.5T
-
=761.5
(3)确定P值和作出推断结论:本题有5个差值d=0,故n=11,查附表10,
得P<0.01,在α=0.05水准上,拒绝Ho,接受H
1
,可认为甲法疗效优
于乙法。
5.表7-5为测得铅作业与非铅作业工人的血铅值(μmol/L),问两组工人的血铅值有
无差别
(1)假设:Ho:两组工人血铅值总体分布相同
H
1
:两组工人血铅值分布不同
α=0.05
(2)求检验统计量:
表7-5铅作业工人和非铅作业工人血铅值(μmol/L)比较
铅作业组非铅作业组
血铅值秩次血铅值秩次
0.8290.241
0.8710.50.242
0.97120.293
1.21140.334
1.64150.445
2.08160.586
2.13170.637
0.728
0.8710.5
10.113
n1=7T1=93.5n2=10T2=59.5
(3)确定P值和作出推断结论,本题较小例数n
1
=7两组例数之差n
2
-n
1
=10-7=3,
查附表11,得P<0.01,在α=0.05水准上拒绝Ho,接受H
1
,铅作业组平均
秩次为93.5/7=13.36,非铅作业平均秩次为59.5/10=5.95,可以认为铅作业
工人的血铅值高于非铅作业工人的血铅值。
6.比较表7-6两组肝炎婴儿的血清总胆红素有无差别?
(1)假设:Ho:两组肝炎婴儿的血清总胆红素总体分布相同
H
1
:两组肝炎婴儿的血清总胆红素总体分布不同
α=0.05
(2)求检验统计量:
表7-6两组肝炎婴儿的血清总胆红素
总胆红素人数秩次范围平均秩次秩和
μmol/L)一般组重症组合计一般组重症组
<17441~42.510
17~10105~149.595
80~1521715~312334546
160~191032~4136.536.5328.5
240~2242~4342.585
320~4444~4745.5182
400~2248~4948.597
合计301949T2=486.5T1=738.5
u=
]12/)1([
]5.02/)1([
21
11
Nnn
NnT
=397.5
12/)149()30(19
5.02/)149(195.738[
计算u
C
:
C=1-Σ()/()(33NNtt
ii
=1-[(43-4)+(103-10)+(173-17)+(103+10)+(23-2)+(43-4)(23-2)]
/(493-49)
=1-5208/117600=0.9557
u
C
=5.379/9557.0=5.520
(3)确定P值和作出推断结论:查附表2,t界值表,v=∞,得P<0.001,按α
=0.05水准,拒绝Ho,接受H
1
,可以认为重症组肝炎婴儿的血清总胆红素高
于一般组。
7.试检验表7-7三组人的血浆总皮质醇测定值有无差别?
(1)假设:Ho:三组人的血浆总皮质醇测定值总体分布相同
H
1
:三组人的血浆总皮质醇测定值总体分布不同或不全相同
α=0.05
(2)计算检验统计量如下表:
表7-7三组人的血浆总皮质醇测定值
正常人单纯性肥胖皮质醇增多症
测定值秩次测定值秩次测定值秩次
0.1110.1722.7020
0.5240.3332.8121
0.6160.5552.9222
0.6980.6673.5923
0.7790.8610.53.8625
0.8610.51.13144.0826
1.02121.38164.3027
1.08131.63174.3028
1.27152.04195.9629
1.92183.75246.6230
Ri96.5117.5251
Ni101010
H=12/[N(N+1)]×ΣR
i
2/n-3(N+1)
=12/[30(30+1)]×(96.52+117.52+2512)/10-3(30+1)=18.122
v=k-1=3-1=2,查附表9,X2界值表,得P<0.005,在α=0.05水准上拒绝
Ho,接受H
1
,可以认为三组人的血浆总皮质醇测定值分布不同。
(3)多样本两两比较如表4-7
Ho:任两组人的血浆总皮质醇测定值总体分布相同
H
1
:任两组人的血浆总皮质醇测定值总体分布不同
α=0.05
两两比较秩和差数的绝对值
各组秩和D=|RA-RB|
单纯性肥胖117.5皮质醇增多症251
正常人96.521154.5
单纯性肥胖117.5133.5
本题n=10,k=3,查附表13,D界值表,D
0.05(10,3)
=92.3,D
0.01(10,3)
=114.7,在
α=0.05水准上,皮质醇增多症与正常人、单纯性肥胖组比较,均拒绝Ho,接受H
1
,
可认为对比组间有差别(P<0.01),而单纯性肥胖与正常人相比,P>0.05,未拒
绝Ho,尚不能认为两组间的血浆总皮质醇测定值有差别。
8.在研究某地方病的病因工作中,用病区的粮食做动物实验,今有两组大白鼠,分别
用甲,乙两种饲料配方饲养,观察鼠的心肌坏死面积(小格数)如表7-8,问两组
间的坏死面积有无差别?本资料用t检验和秩和检验何者为好?为什么?
表7-8甲,乙两组心肌坏死面积(小格数)比较
甲组乙组
面积×频数秩和面积×频数秩和
0.0×1013×100.0×1513×15
0.2×12.750.2×32.75×3
0.3×130.50.3×130.5
0.4×233.5×20.4×233.5×2
0.6×1360.9×237.5×2
1.0×1391.3×140
1.6×1411.7×142
2.2×1432.8×145
2.6×1447.4×153
3.3×14613.0×155
4.3×1
5.1×1
5.4×1
5.5×1
6.1×1
6.2×1
9.7×1
13.8×1
36.0×1
合计n2=29T2=968n1=28T1=685
应用t检验的条件是所分析的数据来自正态分布总体,而且要求相应的两总
体方差相等,故首先列出两组数据的频数分布表。由频数表可见两组数据呈极
度偏态,且总体方差不齐(S甲2=50.32,S乙2=7.66,F6.569,P<0.05),故
应使用秩和检验。
(1)假设:Ho:两组坏死面积的分布相同
H
1
:两组坏死面积的分布不同
α=0.05
(2)计算检验统计量:
u=
12/)1(
5.02/)1([
21
11
Nnn
NnT
=
019.2
12/)157(2928
]5.02/)157(28685[
计算较正u
c
:
C=1-Σ(t3-t
i
)/(N3-N)
=1-[(253-25)+(43-4)+(23-2)+(43-4)]/(573-57)=0.9151
u
C
=111.29151.0/019.2/cu
(3)确定P值和作出推断结论:查附表2,t界值表,v=∞,得0.05>P>0.01,
在α=0.05水准上拒绝Ho,接受H
1
,故可以认为甲乙两组饲料配方饲养大鼠,
心肌坏死面积不同,甲组坏死面积较大。
第八章直线相关与回归
答案
填空题
1、Y
ˆ
=α+bx
2、依存关系,相互关系与密切程度
3、直线回归、截距、回归系数
4、-1——1
5、r与b假设检验是等价的
6、相关关系的密切程度和相关方向指标。
7、回归平方和(
Y
ˆ
-Y)2、剩余平方和Σ(Y-
Y
ˆ
)2
8、截距,回归系数,斜率
9、相互关系的密切程度,相关方向
是非题:
1.√2.×3.√4.√5.×6.×7.×8.√9.×10.√
单选题:
1.D2.C3.D4.D5.C6.D7.B8.D9.E10.B
11.E12.D13.E14.A15.B16.A17.B18.C19.C20.E
问答题:
1.应用直线回归和相关分析时应注意那些问题?
(1)作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相
关分析,必须对两种现象间的内在联系有所认识。
(2)在进行回归和相关分析之前,应绘制散点图。当观察点的分布有直线趋势时,才
适宜作回归、相关分析。如散点图呈明显曲线趋势,应使之直线化再行分析。散点图
还能提示资料有无可疑异常点。
(3)直线回归方程的实用范围一般以自变量的取值范围为限。若无充分理由证明超过
自变量取值范围外还是直线,应避免外延。
(4)双变量的小样本经t检验只能推断总体两变量间有无直线关系,而不能推断相关
的紧密程度,样本含量必须很大。
(5)相关关系不一定是因果关系,也可能是伴随关系,有相关关系不能证明事物间确
有内在联系。
2.用什么方法考察回归直线图示是否正确?
(1)直线必须通过点(YX,)。
(2)若纵横坐标无折断号时,将直线左端延长与纵轴相交,交点的纵坐标必等于截距
α。
(3)直线是否在自变量X的实测范围内。
3.r与r
s
的应用条件有何不同?
积差相关系数r用于描述双变量正态分布资料的相关关系。
等级相关系数r
s
适用于下列资料:
(1)不服从双变量正态分布而不宜作积差相关分析的资料。
(2)总体分布型未知的资料:
(3)原始数据是用等级表示的资料。
4.某资料n=100,X与Y的相关系数为r=0.2,可否认为X与Y有较密切的相关关系?
N=100,r=0.2时,对相关系数进行t检验,按检验水准α=0.05,拒绝Ho(ρ=0),
接受H
1
(ρ≠0),认为两变量有相关关系,但决定系数r2=0.22=0.04,表示回归
平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大。
5.相关系数与回归系数的区别与联系
(1)区别:
①资料要求上:回归要求因变量Y服从正态分布,X是可以精确测量和严
密控制的变量,称Ⅰ型回归;相关要求两个变量X、Y服从双变量正态
分布,这种资料若进行回归分析称为Ⅱ型回归
②应用上:说明两变量间依存变化数量关系用回归,说明变量间的相关关
系用相关。
③意义上:b表示X每增(减)一个单位,Y平均改变b个单位,r说明具
有直线关系的两个变量间相关关系的密切程度与相关方向。
④计算上:b=
XXXY
ll/,r=
YYXYXY
lll/
⑤取值范围:-∞<b<+∞;-1≤r≤1。
⑥单位:b有单位,r没单位。
(2)联系:
①对一组数据若同时计算b和r,它们的正负号一致
②b和r的假设检验是等价的,即对同一样本,t
b
=t
r
。
③用回归解释相关,决定系数r2=l
XY
2/l
XX
l
YY
=SS回/SS总,回归平方和越
接近总平方和,则r2越接近1,说明引入相关的效果越好。
计算题
1.10名20岁男青年身高(cm)与前臂长(cm)如下,问两者有无相关关系?
身高3180165
前臂长454244443
(1)计算相关系数:由原始数据及散点图的初步分析,估计本资料有直线趋势。
ΣΧ=1725,ΣΧ2=298525,
X
=172.5
ΣУ=454ΣУ2=20690,
Y
=45.4ΣΧУ=78541
XX
l
=ΣΧ2-(ΣΧ)2/n=298525-17252/10=962.5
YY
l
=ΣΧ2-(ΣΧ)2/n=20690-4542/10=78.4
XY
l
=ΣΧУ-(ΣΧ)(ΣУ)/n=78541-1725×454/10=226
(2)与ρ=0进行假设检验。
Ho:ρ=0,即身高与前臂长间无直线相关关系
H
1
:ρ=0,即身高与前臂长间有直线相关关系
α=0.05
υ=n-2=10-2=8
查t界值表,得0.002<P<0.005,按α=0.05水准拒绝Ho,
2.某省卫生防疫站对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘行检
测,结果见表,试检验两者有无相关?
表8-18个城市肺癌标化死亡率与大气中苯并(a)芘的相关分析
肺癌标化死亡率(1/10万)
__________________________________________________________________________
城市编号X等级Y等级dd2
(1)(2)(3)(4)(5)(6)=(3)-(5)(7)
15.6010.05100
218.5081.17711
316.2361.05600
411.4030.10211
513.8050.75500
68.1320.503-11
718.0070.65439
812.1041.208416
∑d2=28
本题资料不服从双变量正态分布,宜计算等级相关系数。
Ho:ρ
S
=0,即肺癌标化死亡率与大气中苯并(α)芘无相关关系
H
1
:ρ
S
≠0,即肺癌标化死亡率与大气中苯并(α)芘有相关关系
α=0.05
由上计算表,r
S
=1-6Σd2/[n(n2-1)]=1-6×28/[8×(82-1)]=0.6667查附表15,
r
S
界值表,得0.10>P>0.05,按α=0.05水准不拒绝Ho,尚不能认为肺癌标化死
亡率与大气中苯并(α)芘间有相关关系。
3.就表8-2(1)(2)(4)栏资料分析血小板和出血症的关系。
表8-2血小板数与出血症状的等级相关分析
血小板数(×109/L)出血症状
病例号X等级Y等级dd2
(1)(2)(3)(4)(5)(6)=(3)-(5)(7)
11201++10.5-9.590.25
21302+++12.0-10.0100.00
31603±7.0-4.016.00
43104-3.50.50.25
54205+8.5-3.512.25
65406+8.5-2.56.25
77407-3.53.512.25
810608-3.54.520.25
9126010-3.56.542.25
1012309-3.55.530.25
11144011++10.50.50.25
12200012-3.58.572.25
∑d2=402.5
本例“出血症状”为等级数据,宜计算等级相关系数。
Ho:ρ=0,即血小板数与出血症无相关关系
H
1
:ρ≠0,即血小板数与出血症有相关关系
α=0.05因出血症状Y中相同秩次较多,需计算校正r
S
值r,
S
。
X
T=0
Y
T=Σ(t3-t)/12=[(63-6)+(23-2)+(23-2)]/12=18.5
=
5.182]6/)1212[(0]6/)1212[(
5.402)5.180(]6/)1212[(
33
3
=-0.5059
查附表15,r
S
界值表,得0.10>P>0.05,按α=0.05水准,不拒绝Ho,尚
不能认为血小板数与出血症状间有相关关系
4.某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量(g)
和体重增加量(g)的数据如下:
表8-3八只大白鼠进食量(g)和体重增加量(g)
鼠号12345678
进食量(g)89
体重增加(g)3
(1)此资料有无可疑的异常点
(2)求直线回归方程并对回归系数作假设检验.
(3)试估计进食量为900g时,大白鼠的体重平均增加多少,计算其95%的可信区
间,并说明其含义.
(4)求进食量为900g时,个体Y值的95%容许区间,并解释其意义.
解:(1)由散点图及回归直线综合分析,点(800,185)可视为异常点.
(2)有原始数据求得直线方程
对回归系数作检验
Ho:=0,即进食量与增重无直线关系
H1:0,即进食量与增重有直线关系
=0.05
方差分析法
SS
总
=
7v,875.4052lyy
查F界值表,得P<0.05,按
=0.05的水准,拒绝Ho,接受H
1
可认为进食量与增重间
有直线关系.
t检验法
查t界值表,得P<0.01结论同上.
第九章统计图表
答案
填空题
1.突出重点,简单扼要,主谓分明,层次清楚。
2.标题,标目,线条,数字,备注。
3.频数分布图(直方图)。
是非题
1.√2.√3.×4.√5.×6.×7.×
单选题:
1.A2.B3.D4.E5.D6.D7.D8.B9.D10.C
11.E12.D13.E14.E15.C16.E17.A18.C19.B20.E
21.C
问答题:
1.列表的原则和基本要求是什么?
(1)列表的原则:重点突出,简单明了;主谓分明,层次清楚。
(2)列表的基本要求:
①应有简明扼要说明统计表内容的标题。既不能过与简略,也不呢能过于繁琐
或不确切。
②标目文字要简明,有单位的标目要注明,标目不宜过多,层次应清楚。
③线条不宜过多。除顶线、底线、纵标目下与合计行上面的线条外,其他线条
一般均应省去。表的左上角不宜有斜线。
④表内数字小数位数保留应一致,位次应对齐,不宜留空格。暂缺或未记录用
“…”表示,无数字用“—”表示,数字是“0”则应填写“0”。
⑤备注一般不列入表内,应用“*”号引出,写在表的下面。
2.常用的统计图有哪几种?他们的适用条件是什么?
常用的统计图有条图、百分条图、圆图、线图、半对数线图、直方图、散点图
和统计地图等。
(1)直条图:用等宽直条的长短来表示相互独立的各项指标的数值大小,如发病率等。
(2)百分条图、圆图:用长条各段的面积、圆的扇形面积来表示事物内部各构成部分
的分布情况,即各构成比重的大小,如构成比。
(3)普通线图:用线段的升降来表示连续性资料随时间的变迁、某事物现象的动态及
变化趋势。
(4)半对数线图:用线段的升降来表示连续性资料随时间的变迁和某事物现象发展变
化的速度。
(5)直方图:用直方面积的大小表示数值变量资料频数分布的情况。
(6)散点图:用点的密集程度和趋势表示两变量间的相关关系。
(7)统计地图:用不同的纹线或颜色说明指标高低,描述某事物现象在行政区域上的
分布情况。
3.某医院对麦芽根糖浆治疗急慢性肝炎161例的疗效列表9-1,试作改进。
表9-1麦芽根糖浆治疗急慢性肝炎疗效观察
效果
总
例数
有效
无效
小计近期痊愈好转
例%例%例%例%
16110867.17043.53823.65332.9
改后如下表:
表9-2麦芽根糖浆治疗急慢性肝炎疗效观察
疗效例数疗效构成比(%)
无效5332.92
好转3823.60
近期痊愈7043.48
合计161100.00
计算题
1.某防疫站1972年开始在城关建立“预防接种卡”使计划免疫得到加强。为说明
效
果,1975年的5月观察了482人的锡克试验反应,其中:幼儿园儿童101人,阳性
21人,小学生145人,阳性22人;中学生236人,阳性15人。相比起来,1974
年为:幼儿园儿童144人,阳性37人,小学生1417人,阳性323人;中学生259
人,阳性41人。试用适当的统计表和统计图描述上述结果,并作简要分析(表9-3)
表9-3某县两年不同人群锡克试验反应结果分析
19741975
调查人数阳性人数阳性率(%)调查人数阳性人数阳性率(%)
幼儿园1443725.691012120.79
小学生141732322.791452215.17
中学生3594111.42236156.36
第十章实验与调查设计
答案
填空题
1、处理因素,受式对象,实验效应
2、对照原则,均衡原则,随机化原则,重复原则
3、第一类错误概率α即检验水准,检验效能1-β,容许误差,总体标准差或用“S”
来代替
4、空白对照,实验对照,标准对照,历史对照,自身对照,相互对照,
5、普查,非全面(抽样调查)典型调查
6、单纯随机抽样,系统抽样,整群抽样,分层抽样
7、标准对照
是非题:
1.√2.√3.√4.×5.√6.√7.×8.×9.×
单选题:
1.E2.C3.E4.D5.D6.C7.A8.D9.B10.D
11.A12.A13.E14.C15.D16.C
问答题:
1.1976年某单位报告了果胶驱铅的疗效观察。30名铅中毒工人脱离现场后住院治疗,
治疗前测得尿铅的均数为0.116mg/L,血铅均数为1.81mg/L。服用20天后再测,尿
铅均数降为0.087mg/L,血铅均数降为0.73mg/L。说明果胶驱铅有较好的驱铅作用。
此实验目的是要观察果胶的驱铅作用。人体对外来有害物质有解毒功能,因而铅
中毒者在脱离现场后经一段时间,血、尿中铅含量会下降(自然排铅)。该设计最
大缺点就在于无对照,其结果不知血铅和尿铅的下降是果胶的作用,还是人体自然
排铅的结果。另外,只凭上述血铅和尿铅在治疗前后的均数,不作假设检验就下“果
胶有较好的驱铅作用”的结论自然不妥,较好的设计应将30名患者随机分为两组,
一组给予果胶,另一组给予具有肯定作用的驱铅药物如EDTA(即标准对照)等,经
治疗一定时间后,以两组血铅及尿铅的变化值作假设检验,再下结论。
2.某单位研究菊花艾叶香预防感冒及空气消毒效果,对象为某幼儿园分住三个楼的儿
童。中楼是中班的儿童(160人),东楼是小班(80人)的儿童,此两楼燃香;西楼
是大班(160人)的儿童,不燃香为对照组,结论为该艾叶香无预防感冒效果,但有
空气消毒作用(肉汤平板上菌落数较少)。
该试验目的是观察野菊花艾叶香预防感冒和空气消毒的作用,但三组之间缺乏
均衡性:
(1)三栋楼房条件不同。
(2)三组儿童年龄不同:不同年龄儿童对感冒抵抗力不同,大班儿童自然会比中班、
小班儿童对感冒抵抗力强,故无法观察预防感冒的作用。
(3)设立对照也有问题,空气消毒是野菊花艾叶香的燃香作用,还是烟作用无法区
别,故达不到试验目的。应设立实验对照。
3.为寻找营养丰富而有经济实惠的婴幼儿食品,以搞好儿童保健,某研究所利用甘蔗
废糖蜜试制了L-赖氨酸(简称赖氨酸盐)。通过实验研究了解膳食中添加赖氨酸盐
后对正常儿童生长发育有无影响,如何考虑:
(1)实验组与对照组的设置均衡性:
实验组与对照组条件要均衡,除处理因素外,其它条件应尽量相同,因此应
选全托儿所的同龄、身体发育正常、健康的儿童作为观察对象,使实验组与对照
组应在性别、年龄、生活条件、健康知识等有关因素尽量做到相近。
(2)实验对象的随机化分配方法:
将符合条件的实验对象依花名册顺序号,使用随机数字表,按随机原则进行分组。
样本含量借助参考文献各项指标的数据,设定α,1-β进行样本例数估计。
(3)实验持续时间及观察指标、项目:
实验持续时间的确定以能看出显着变化为原则,如持续时间短,区别不出效
应指标的变化;而持续时间过长,则给试验带来较多的困难与人力、物质的浪费。
观察指标:①形态指标:身高、体重、胸围、坐高、皮下脂肪厚度等;②功能指
标:脉搏、血压、肺活量、呼吸次数等;③生化指标:Hb(g/L)、WBC(×
109/L)等。
(4)统计分析表及统计分析方法:
1)计算各项指标实验前、后均值、标准差(见表)。
2)作统计分析以了解每组实验前后标化是否有统计意义,可按组别对各项指标受
试前后进行配对t检验,再对两组实验前后的差数用成组设计两均数比较的t
检验,检验实验组与对照组各项指标差别有无统计意义。
表不同食物组实验前后儿童生长发育指标比较(
X
±S)
指标普通食物组加赖氨酸盐组
实验前实验后实验前实验后
身高(cm)
体重(kg)
:
脉搏(次/分)
血压(kPa)
:
Hb(g/L)
WBC(×109/L)
4.调查研究和实验研究的主要区别何在?
按研究是否对观察对象施加干预(即处理因素)可分为调查与实验。调查即研究
者只是被动的调查客观实际情况,而未加任何干预。实验比调查能更好地控制误差。
基于上述差别,调查与实验研究在统计分析上也不尽相同。
(1)调查研究:①研究因素(处理因素)是客观存在的;②不能通过随机化分组的方
法来平衡混杂因素。
(2)实验研究:①研究者能人为设置处理因素;②受试对象接受何种处理因素或水平
是由随机分配而定。
5.估计样本例数的意义何在?需要确定那些前提条件?
(1)估计样本例数的意义:在调查或实验研究中都要对样本例数进行估计,如果例数
太少,有可能把个别情况误认为普遍情况,把偶然性或巧合的现象当做必然规律
现象,以至错误地推论到总体,例数太多,势必造成人力、物力的浪费。在保证
实验结果有一定可靠性的条件下,确定最少的样本例数,以节约人力和经费。
(2)样本含量的估计可分为两类,一类是作参数估计时的样本含量估计;另一类是作
指标比较时的假设检验中样本含量的估计。两种方法不同,决定样本含量的因素
亦有所不同。现分述如下。
1)参数估计时,影响样本含量的因素有:①容许误差δ。容许误差越小,所需
样本含量越多;②Ⅰ型错误的概率α。α越小,则所需样本含量越多;③总体
标准差σ。σ越大,所需样本含量越大;④总体是无限总体,所需样本含量
较多;如系有限总体则总体单位数越小,所需样本含量也越少。
2)指标比较时,决定样本含量的因素是:①Ⅰ型误差的概率α。α越小,样本含
量越大;②检验效能1-β。β为Ⅱ型误差的概率,1-β越大,所需样本含量
越大;③容许误差δ。δ越小则样本含量越大;④总体标准差σ或总体率
π。σ越小,n越小,π越接近0.5样本含量越大;⑤单侧检验所需样本含
量较少,双侧检验所需样本含量较多。
6.调查研究和实验研究的只要区别何在?
按研究是否对观察对象施加干预(即处理因素)可分为调查与实验。调查即研
究者只是被动的调查客观实际情况,而未加任何干预。实验比调查能更好地控制误
差。基于上述差别,调查与实验研究在统计分析上也不尽相同。
(1)调查研究:①研究因素(处理因素)是客观存在的;②不能通过随机化分组
的方法来平衡混杂因素。
(3)实验研究:①研究者能人为设置处理因素;②受试对象接受何种处理因素
或水平是由随机分配而定。
7.估计样本例数的意义何在?需要确定那些前提条件?如何进行估算?
(1)估计样本例数的意义:在调查或实验研究中都要对样本例数进行估计,如
果例数太少,有可能把个别情况误认为普遍情况,把偶然性或巧合的现象当
做必然规律现象,以至错误地推论到总体,例数太多,势必造成人力、物力
的浪费。在保证实验结果有一定可靠性的条件下,确定最少的样本例数,以
节约人力和经费。
(2)样本含量的估计可分为两类,一类是作参数估计时的样本含量估计;另一
类是作指标比较时的假设检验中样本含量的估计。两种方法不同,决定样本
含量的因素亦有所不同。现分述如下。
1)参数估计时,影响样本含量的因素有:①容许误差δ。容许误差越小,所
需样本含量越多;②Ⅰ型错误的概率α。α越小,则所需样本含量越多;③
总体标准差σ。σ越大,所需样本含量越大;④总体是无限总体,所需样本
含量较多;如系有限总体则总体单位数越小,所需样本含量也越少。
2)指标比较时,决定样本含量的因素是:①Ⅰ型误差的概率α。α越小,样本
含量越大;②检验效能1-β。β为Ⅱ型误差的概率,1-β越大,所需样本含
量越大;③容许误差δ。δ越小则样本含量越大;④总体标准差σ或总体
率π。σ越小,n越小,π越接近0.5样本含量越大;⑤单侧检验所需样本
含量较少,双侧检验所需样本含量较多。
如何进行样本含量估算,根据已知条件,区别调查研究还是实验中统计量的
比较,以及数值变量还是分类变量,可按样本估计的专用公式计算,或查样
本例数估计专用表。
8.实验为什么要设对照组?如何设对照组?
设对照可以使处理因素和非处理因素的差异有一个科学的对比。
设立对照的目的是抵消对照组与处理组非处理因素的影响,处理因素效应得以充
分显示出来。主要有空白对照、安慰剂对照、实验对照、标准对照、历史对照、
自身对照和相互对照等六种形式,可以根据研究目的和内容加以选择。
9.常用的实验设计有那些?
(1)完全随机设计。亦称单因素设计
(2)配对设计
(3)配伍组设计,亦称随机区组设计,是配对设计的扩大。
(4)析因试验设计、拉丁方设计、正交设计,这些都是多因素,高效率的实验设计。
计算题
1.根据既往观察,人群接种某预防制剂后,体温高于37.5℃的反应率为10%,今欲推
广使用,拟再次证实,要求容许误差在真实反应率的20%以内,α=0.05,问按单
纯随机抽样需观察多少人?
本题为调查总体率的样本含量估计。已知:
π=0.1,δ=0.2×π=0.2×0.1=0.02,双侧u
0.05
=1.96
n=
2
a
u(1-π)/δ2
=1.962×0.1×0.9/(0.2×0.1)2≈865(人)
2.拟用放射免疫法检测某人群(5000人)血液中流行性脑脊髓膜炎(流脑)特异免
疫球蛋白含量,根据文献报告,本例为计量资料有限总体抽样的样本含量估计,其
标准差为0.5mg/L,容许误差为0.1ml/L,试按单纯随机抽样估计样本例数。
已知:N=5000,σ=0.5μg/ml,δ=0.1μg/ml。
若规定:双侧α=0.05,u
0.05
=1.96
则:n=(U
α
σ/δ)2=(1.96×0.5/0.1)2=96.04≈97(人)
n
C
=n/(1+n/N)=97/(1+97/5000)
=95.15≈96(人)
3.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,将
全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果如表
10-1,试估计该县百白破疫苗接种率的95%可信区间。
表10-1某县三类乡百白破疫苗接种率调查结果
类别人数抽样人数接种率
好73717230.8174
较好1489914780.6969
差93089300.3022
合计315783131
本题为求按比例分配的分层抽样中总体率的可信区间,首先计算接种率及其标准
误。
(1)p=[ΣΝ
i
Ρ
i
]/Ν=[7371×0.8174+14899×0.6969+9308×0.3022]/31578
=19221.0461/31578=0.608685
(2)NnppNnNs
iiiiip
/)1/()1()[(/1(2
=31578/)}1930/(6978.03022.0)[9308/9301(
2
9308)]1723/(1826.08174.0)[7371/7231(
2
7371
=0.007520
该率不接近于0或1,一般认为服从二项分布。因n=3131,较大,可用正态近似法
计算其可信区间。
95%CI:P±1.96Sp=0.608635±1.96×0.007520=(0.5939,0.6234)