医学统计学第七版课后答案及解析

发布时间：2023-06-06 作者：admin 来源：文学

医学统计学第七版课后答案及解析

充电桩项目-交流调压电路

2023年2月20日发(作者：铁路网上售票系统)

医学统计学

第一章绪论

答案

名词解释：

（1）同质与变异：同质指被研究指标的影响因素相同，变异指在同质的基

础上各观察单位（或个体）之间的差异。

（2）总体和样本：总体是根据研究目的确定的同质观察单位的全体。样本

是从总体中随机抽取的部分观察单位。

（3）参数和统计量：根据总体个体值统计算出来的描述总体的特征量，称

为总体参数，根据样本个体值统计计算出来的描述样本的特征量称为

样本统计量。

（4）抽样误差：由抽样造成的样本统计量和总体参数的差别称为抽样误

差。

（5）概率：是描述随机事件发生的可能性大小的数值，用p表示

（6）计量资料：由一群个体的变量值构成的资料称为计量资料。

（7）计数资料：由一群个体按定性因数或类别清点每类有多少个个体，称

为计数资料。。

（8）等级资料：由一群个体按等级因数的级别清点每类有多少个体，称为

等级资料。

是非题：

1.×2.×3.×4.×5.√6.√7.×

单选题：

1.C2.E3.D4.C5.D6.B

第二章计量资料统计描述及正态分布

答案

名词解释：

1.平均数是描述数据分布集中趋势（中心位置）和平均水平的指标

2.标准差是描述数据分布离散程度（或变量变化的变异程度）的指标

3.标准正态分布以μ服从均数为0、标准差为1的正态分布，这种正态分布

称为标准状态分布。

4.参考值范围参考值范围也称正常值范围，医学上常把把绝

大多数的某指

标范围称为指标的正常值范围。

填空题：

1.计量，计数，等级

2.设计，收集资料，分析资料，整理资料。





u（变量变换）标准正态分布、0、1

4.96.158.268.27%95%99%

5.47.5%

6.均数、标准差

7.全距、方差、标准差、变异系数

8.96.158.2

9.全距R

10.检验水准、显着性水准、0.05、0.01（0.1）

11.80%90%95%99%95%

12.95%99%

13.集中趋势、离散趋势

14.中位数

15.同质基础，合理分组

16.均数，均数，μ，σ，规律性

17.标准差

18.单位不同，均数相差较大

是非题：

1.×2.√3.×4.×5.×6.√7.√8.√9.√10.√

11.√12.√13.×14.√15.√16.×17.×18.×19.√20.√

21.√

单选题：

1.B2.D3.C4.A5.C6.D7.E8.A9.C10.D

11.B12.C13.C14.C15.A16.C17.E18.C19.D20.C

21.B22.B23.E24.C25.A26.C27.B28.D29.D30.D

31.A32.E33.D34.A35.D36.D37.C38.E39.D40.B

41.C42.B43.D44.C45.B

问答题：

1．均数﹑几何均数和中位数的适用范围有何异同？

答:相同点,均表示计量资料集中趋势的指标。

不同点:表2-5.

表2-5均数,几何均数和中位数的相异点

平均数意义应用场合

均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布

几何均数平均增减倍数①等比资料；②对数正态分布资料

中位数位次居中的观①偏态资料；②分布不明资料；③分布一端或两

察值水平端出现不确定值

2．中位数与百分位数在意义上﹑计算和应用上有何区别与联系？

答:

1）意义：中位数是百分位中的第50分位数，常用于描述偏态分布资料的集中位置，

反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某

百分位置的水平，最常用的百分位是P

即中位数。多个百分位数结合使用，可

更全面地描述总体或样本的分布特征。

（2）计算：中位数和百分位数均可用同一公式计算，即

Px=L+（i/f

）（n·x%-Σf

）

可根据研究目的选择不同的百分位数代入公式进行计算分析。

（3）应用：中位数常用于描述偏态分布资料的集中趋势；百分位数常用于医学参考

值范围的确定。中位数常和其它分位数结合起来描述分布的特征，在实际工作中

更为常用。百分位数还可以用来描述变量值的离散趋势（四分位数间距）。

3．同一资料的标准差是否一定小于均数？

答：不一定。同一资料的标准差的大小与均数无关，主要与本资料的变异度有关。

变异大，标准差就大，有时比均数大；变异小，标准差小。

4．测得一组资料，如身高或体重等，从统计上讲，影响其标准差大小的因素有哪些？

（1）样本含量的大小，样本含量越大，标准差越稳定。

（2）分组的多少

（3）分布形状的影响，偏态分布的标准差较近似正态分布大

（4）随机测量误差大小的影响

（5）研究总体中观察值之间变异程度大小

5．正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同？

（1）概念上：①相同点：正态分布、标准正态分布与对数正态分布都是变量的

连续型分布。其特征是：分布曲线在横轴上方，略呈钟型，以均数为中心，两边

对称，均数处最高，两边逐渐减小，向外延伸，不与横轴相交。②相异点：表示

方法不同，正态分布用N（μ，σ2）表示，标准正态分布用N（0，1）表示，对

数正态分布N（μ

lgX

，σ2

lgX

）表示。

（2）应用上：①相同点：正态分布、对数正态分布都可以转换为标准正态分布。

②相异点：标准正态分布是标准正态变量u的分布，标准正态曲线下的面积唯一

的由u决定，给应用带来极大方便。对医学资料呈偏态分布的数据，有的经对数

变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征，可用

于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。

6．医学中参考值范围的含义是什么？确定的原则和方法是什么？

含义：参考值范围亦称正常值范围，它是指特定健康状况人群（排除了有关

疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念）的解

剖、生理、生化等数据绝大多数人的波动范围。

（2）原则：

①抽取有代表性的足够例数的正常人群样本，样本分布越接近总体，所得结

果越可靠。一般认为样本含量最好在100例以上，以能得到一个分布较为

稳定的样本为原则。

②对选定的正常人进行准确而统一的测定，保证测定数据可靠是确定正常值

范围的前提。

③判定是否要分组（如男女、年龄、地区等）确定正常值范围。

④决定取双侧范围值还是单侧范围值。

⑤选择适当的百分范围

⑥确定可疑范围

⑦估计界值

（3）方法：

①百分位数法：P

=L+（i/f

）（n·x%-Σf

）

②正态分布法（对数正态分布）：

百分位数法用于各种分布型（或分布不明）资料；正态分布法用于服从或近

似正态分布（服从对数正态分布）的资料。

7．对称分布资料在“均数±1.96倍标准差”的范围内，也包括95%的观察值吗？

答：不一定。均数±1.96倍标准差是正态分布的分布规律，对称分布不一定是正

态分布。

计算题：

1.某地101例30～49岁健康男子血清总胆固醇值（mmol/L）测定结果如下：

4.773.376.143.953.564.234.314.715.694.12

4.564.375.396.305.217.225.543.935.216.51

5.185.774.795.125.205.104.7040743.504.69

4.384.896.255.324.504.633.614.444.434.25

4.035.854.093.354.084.795.304.973.183.97

5.165.105.864.795.344.244.324.776.366.38

4.865.553.044.553.354.874.175.855.165.09

4.524.384.314.585.726.554.764.614.174.03

4.473.043.912.704.604.095.965.484.404.55

5.383.894.604.473.644.345.186.143.244.90

3.05

（1）编制频数分布表，简述其分布特征。

①找出最大值、最小值求全距（R）：

全距=最大值-最小值=7.22-2.70=4.50（mmol/L）

②求组距：I=全距/组数=4.52/10=0.452≈0.5（mmol/L）

③分组段，划记（表1-1）

表2-6某地101例30～49岁健康男子血清总胆固醇值划记表

组段(mmol/L)划记频数

2.5～1

3.0～8

3.5～9

4.0～23

4.5～25

5.0～17

5.5～9

6.0～6

6.5～2

7.0～7.51

合计101

由表2-6可知，本例频数分布中间局多，两侧逐渐减少，左右基本对称。

表2-7某地101例30～49岁健康男子血清总胆固醇值（mmol/L）X、s计算表

血清总胆组中值频数fXfX2累计累计频数

固醇值Xf频数(实际)

2.5～2.7512.757.56310.0099

3.0～3.25826.0084.50090.0891

3.5～3.75933.75126.563180.1782

4.0～4.252397.75415.438410.4059

4.5～4.7525118.75564.063660.6535

5.0～5.251789.25468.563830.8218

5.5～5.75951.75297.563920.9109

6.0～6.25637.50234.375980.9703

6.5～6.75213.5091.1251000.9901

7.0～7.57.2517.2552.5631011.0000

478.252242.315

注：Xu为组段上限值

（2）计算均数

、标准s、变异系数CV。

由上计算表1-2可见：ffXX/478.25/101=4.735（mmol/L）

1101

101/)25.478(313.23422





=0.882（mmol/L）

CV=xs/100%=0.882/4.735100%=18.627%

（3）计算中位数M，并与均数X比较，利用前表计算中位数M

M=L+（i/f

）（n50%-Σf

）

=4.5+（0.5/25）（10150%-41）=4.69（mmol/L）

本题算术均数为4.735（mmol/L），与中位数4.69（mmol/L）很接近，这也是

资料服从正态分布的特征之一。

（4）计算P2.5及P97.5并与X±1.96s的范围比较。

2。5

=3.0+（0.5/8）（1012.5%-1）=3.095（mmol/L）

97.5

=6.5+（0.5/2）（10197.5%-98）=6.619（mmol/L）

X1.96

=4.735±1.960.882=3.01～6.46（mmol/L）

用百分位数法求得101例30～49岁健康男子血清总胆固醇值95%分布范围

3.095～6.619（mmol/L），与正态分布法求得的95%分布范围3.01～6.46

（mmol/L）基本一致。

（5）分别考察X1

、X1.96

、X2.58

范围内的实际频数与理论分布是否基

本一致（表1-3）

表2-8某地101例30～49岁健康男子血清总胆固醇值理论分布与实际分布比较

usX血清总胆固醇实际分布理论分布

人数%%

sX13.85～5.627271.2968.27

sX96.13.01～6.469796.0495.00

sX58.22.46～7.0110099.0199.00

由上表,

sX1

范围内,实际分布与理论分布略有不同,而

sX96.1

、

sX58.2

范围内，实际分布与理论分布基本一致。

（6）现测得一40岁男子的血清总胆固醇值为6.993（mmol/L），若按95%正常值

范围估计，其血清总胆固醇值是否正常？估计该地30～49岁健康男子中，

还有百分之几的人血清总胆固醇值比他高？

前计算得95%正常值为3.01～6.46（mmol/L）现测得一40岁男子的血清总

胆固醇值为6.993（mmol/L），在95%范围以外，故属于异常

u=（X-μ）/σ=（6.993-4.735）/0.882=2.56

因ф（2.56）=ф（-2.56），查表1得ф（-2.56）=0.0052

估计该地30～49健康男子中约有0.52%的人血清总胆固醇值比他高。

2．某地卫生防疫站，对30名麻疹易感儿童经气溶胶免疫一个月后，测得其得血凝抑

制抗体滴度资料如表2-9第（1）（2）栏。

表2-9平均滴度计算表

抗体滴度人数f滴度倒数X1lgX1flgX1

（1）（2）（3）（4）（5）=（2）×（4）

1：8280.90311.8062

1：166161.20417.2247

1：325321.50517.5257

1：6410641.806218.0618

1：12841282.10728.4288

1：25622562.40824.8165

1：51215122.70932.7093

合计3050.5730

（1）试计算其平均滴度。

由表1-4得，G=lg-1（50.5730/30）=lg-11.6858=48.5

该站30名麻疹易感儿童经气溶胶免疫一个月后，测得血凝抑制抗体平均滴度为

1：48.50

表2-10平均滴度计算表

抗体滴度人数f滴度倒数X

lgX

flgX

(1)(2)(3)(4)(5)=(2)(4)

1﹕8280.90311.8062

1﹕166161.20417.2247

1﹕325321.50517.5257

1﹕6410641.806218.0618

1﹕12841282.10728.4288

1﹕25622562.40824.8165

1﹕51215122.70932.7093

合计3050.5730

（2）有人发现本例用抗体滴度稀释倍数和直接用滴度（原书误为倒数）算得对

数值的标准差相同，为什么？

表2-11滴度对数值计算表

抗体滴度X

人数flgX

flgX

1﹕82-0.9031-1.8062

1﹕166-1.2041-7.2247

1﹕325-1.5051-7.5257

1﹕6410-1.8062-18.0618

1﹕1284-2.1072-8.4288

1﹕2562-2.4082-4.8165

1﹕5121-2.7093-2.7093

合计30-50.5730

1）由表1-4中数据计算标准差为：slgx

=lg-10.4444=2.7823

2)由表1-5中数据计算标准差为：slgx

=lg-10.4444=2.7823

直接用抗体滴度的对数lgx

与稀释倍数的对数lgx

计算标准差是相等的，因

为由上表可见lgx

=lg1-lgX

=-lgx

，而lgx

与-lgx

的离散程度是相同的，所以用

抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。

3．50例链球菌咽峡炎患者的潜伏期如表2-12，说明用均数、中位数或几何均数，

何者的代表性较好？并作计算。

表2-1250例链球菌咽峡炎患者的潜伏期的中位数计算表

潜伏期(小时)病例数f累计频数

12～11

24～78

36～1119

48～1130

60～7

72～5

84～4

96～2

108～1202

合计50

本例目测频数分布为偏态分布，长尾拖向右侧，故为正偏态，宜用中位数及几

何均数表示其平均水平。

如上表，经计算中位数，几何均数、算术均数分别为：

M=54.55（小时），G=54.08（小时），X=58.56（小时）显然，算术均数受长潜

伏期的影响使其偏大，中位数M与几何均数G接近，故描述链球菌咽峡炎患者潜伏

期的集中趋势指标使用中位数M或几何均数G均可。

4.某市1974年为了解该地居民发汞的基础水平，为汞污染的环境监测积累资料，调查

了留住该市一年以上，无明显肝、肾疾病，无汞作业接触史的居民238人，发汞含量

如表2-13：

表2-13238人发汞含量频数计算表

发汞值人数f组中值XfXfX2累计频数累计频率

（μmol/kg）

1.5～202.550.0125.00208.40

3.5～664.5297.01336.508636.10

5.5～606.5390.02535.0014661.34

7.5～488.5408.03468.0019481.50

9.5～1810.5189.01984.5021289.08

11.5～1612.5200.02500.0022895.80

13.5～614.587.01261.5023498.32

15.5～116.516.5272.2523598.74

17.5～018.50.00.0023598.74

19.5～21.5320.561.51260.75238100.00

合计2381699.014743.50

(1)．说明此频数分布的特征：可见发汞值的频数分布高峰位于第2个组段。前

4个组段的频数占总频数的81.5%，长尾拖向右侧，呈极度正偏态。

(2).计算均数和中位数M，何者较大？为什么？何者用语说明本资料的集中

位置较合适？

ffXX/=1699/238=7.139（μmol/kg）

M=L+（i/f

）（n50%-Σf

）

=5.5+2/60(23850%-86)=6.6（μmol/kg）

由计算结果得知,

MX

其原因因为本例呈正态分布,均数计算结果受到少

数较大发汞值的影响,使得X偏向大发汞值一边.本例用中位数描述偏态资

料的集中趋势较好,它不受两端较大值和极小值的影响.

(3).选用何种指标描述其离散程度较好

选用四分位数间距描述其离散程度较好.

(4).估计该地居民发汞值的95%参考值范围

本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大，

n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范

围较为合适.

=L+(i/f

)(n95%-Σf

)

=11.5+(2/16)(23895%-212)=13.2625（μmol/kg）

第三章均数的抽样误差与t检验

答案

填空题：

1.标准误

2.0.05，0.01

3.假设检验，（显着性检验）

4.两总体均数不同（越有理由说明有统计学意义）

5.自由度大小

6.一是准确度、二是精度

7.抽样误差、样本均数、总体均数

8.总体均数估计、假设检验

9.第二类错误（Ⅱ型错误）β

是非题：

1.√2.×3.×4.×5.√6.√7.×8.√9.×10.√

11.√12.×13.√14.√15.√16.√17.√18.√19.×20.×

21.×22.×

单选题：

1.A2.E3.D4.E5.E6.E7.D8.A9.D10.D

11.D12.B13.E14.D15.D16.E17.B18.C19.C20.D

21.C

问答题：

1．标准差和标准误有何区别和联系？

表3-6标准差与标准误的区别

标准差（α或s）标准误（

xsxa或

）

意义上描述一组变量值之间的离散趋势描述样本均数间的离散趋势

应用上①s越小，表示变量值围绕①xs越小，表示样本均数与

均值分布越密集，说明均数总体均数越接近，说明样本

的代表性越好。均数推断总体均数可靠性越大。

②可用suX

估计变量值分②可用xstX

,估计总体

布范围均数可信区间

与n的关系n越大，s越趋于稳定n越大，xs越小

（2）联系

①二者均是表示变异度大小的统计指标。

②标准误

n/x

与标准差大小成正比，与抽样例数n的平方根成反

比。

③当n一定时，同一份资料，标准差越大，标准误也越大。

2．可信区间和参考值范围有何不同？

参考值范围是指同质总体中个体变量值的分布范围，如X±1.96s说明有

95%的变量值分布在此范围内，它与标准差的大小有关，若个体变异越大，

该范围越宽，分布也就越散。而可信区间是指在可信度为（1-α）时，估

计总体参数可能存在的范围。即从同一总体中随机抽样，当n一定时，每

抽一次即可得一个样本均值，以xstX

,计算可信区间，如95%可信区间，

类似的随机抽样进行一百次，平均有95次，即有95个可信区间包括了总

体均数，有5次没有包括括总体均数，5%是小概率事件，实际发生的可能

性很小，因此实际应用中就认为总体均数在求得的可信区间。这种估计方

法犯错误的可能性最大不超过5%。可信区间与标准误大小有关，标准误越

大，可信区间则越大。

3．假设检验和区间估计有何联系？

假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间

是否有质的区别，并可获得样本统计量，以得到相对精确的概率值。而可信

区间用于推断总体参数的大小，它不仅可用以回答假设检验的问题，尚可比

假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验，因为

假设检验可得到P值，比较精确地说明结论的概率保证，而可信区间只能告

诉我们在某α水准上有无统计意义，却不能像P那样提供精确的概率。因此，

只有将二者有机地结合起来，相互补充，才是完整的分析。

4．假设检验时，一般当P<0.05时,则拒绝H0,理论依据是什么

假设检验时，当P＜0.05，则拒绝Ho，其理论依据是在Ho成立的条件下，

出现大于等于现有检验统计量的概率P＜0.05，它是小概率事件，即在一次

抽样中得到这么小概率是事件是不大可能发生的，因而拒绝它。由此可见，

假设检验的结论是具有概率性的，它存在犯错误的可能性小于等于0.05。

5．t检验和方差分析的应用条件有何异同？

（1）相同点：在均数比较中，t检验和方差分析均要求各样本来自正态总体；各处理

组总体方差齐且各随机样本间相互独立，尤在小样本时更需注意。

（1）不同点：t检验仅用于两组资料的比较，除双侧检验外，尚可

进行单侧检验，亦可计算一定可信度的可信区间，提示差别有无实际意义。而方

差分析用于两组及两组以上均数的比较，亦可用于两组资料的方差齐性检验。

6.怎样正确使用单侧检验和双侧检验？

根据专业知识推断两个总体是否有差别时，是甲高于乙，还是乙高于甲，两种可

能都存在时，一般选双侧；若根据专业知识，如果甲不会低于乙，或研究者仅关心

其中一种可能时，可选用单侧。一般来讲，双侧检验较稳妥故较多用，在预实验有

探索性质时，应以专业知识为依据，它充分利用了另一侧的不可能性，故检出效率

高，但应慎用。

7.第一类错误与第二类错误的区别及联系何在？了解这两类错误有何实际意义？

（1）假设检验中Ⅰ、Ⅱ型错误的区别。

Ⅰ型错误是拒绝了实际上成立的Ho，也称为“弃真”错误，用α表

示。统计推断时，根据研究者的要求来确定。

Ⅱ型错误是不拒绝实际上不成立的Ho，也称为“存伪”错误，用β

表示。它只能与特定的H

结合起来才有意义，一般难以确切估计。

（2）Ⅰ、Ⅱ型错误的联系。

①当抽样例数一定时，α越大，β越小；反之，α越小，β越大。

②统计推断中，Ⅰ、Ⅱ型错误均有可能发生，若要使两者都减小，

可适当增加样本含量。

③根据研究者要求，n一定时，可通过确定α水平来控制β大小。

（3）了解两类错误的实际意义。

①可用于样本含量的估计。

②可用来计算可信度（1-α），表明统计推断可靠性的大小。

③可用于计算把握度（1-β），来评价检验方法的效能等。

④有助于研究者选择适当的检验水准。

⑤可以说明统计结论的概率保证。

计算题：

1.某地抽样调查了部分成人的红细胞数和血红蛋白量，结果如表：

表3-7:健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算

性别例数均数标准差标准值变异系数（%）标准误

红细胞数男3604.660.584.8412.450.0306

（×1012/L）女2254.180.294.336.940.0182

血红蛋白男360134.57.1140.25.280.3742

（g/L）女255117.610.2124.78.670.6387

（1）说明女性的红细胞数与血红蛋白量的变异程度何者为大？

女性CV

RBC

=S/

×100%=0.29/4.18×100%=6.49%

=S/

×100%=10.2/117.6×100%=8.67%

由上计算可知该地女性血红蛋白量比红细胞数变异度大

（2）分别计算男﹑女两项指标的抽样误差。

见上表最后一栏，标准误计算公式nss

/。

（3）试估计该地健康成年男﹑女红细胞数的均数。

健康成年男子红细胞数总体均数95%可信区间为：

±1.96Sx=4.66±1.96×0.0306=4.60～4.72（1012/L）

其中n=360故近似按υ=∞。同理健康成年女子红细胞数总体均数95%可信区

间为4.14～4.22（1012/L）

（4）该地健康成年男﹑女间血红蛋白含量有无差别？

Ho：μ

男

=μ

女

：μ

男

≠μ

女

α=0.05

255/2.10360/2.7/)6.1175.134()/()(22

2121

xxsXX=22.83

按υ=∞，查附表2，得P＜0.0005，按α=0.05水准，拒绝Ho，接受H

，可

以认为男女间血红蛋白含量不同，男高于女。

2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月

的血沉(mm/小时)如下表，问：

（1）甲，乙两药是否均有效？

（2）甲，乙两药的疗效有无差别？

表3-8甲，乙两药治疗前后的血沉

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

病人号

甲━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

药治疗前19

治疗后693101042533

差值4431036326

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

病人号

乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

药治疗前9110

治疗后6353358274

差值37410512936

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

（1）甲，乙两药是否均有效？

经计算得：

甲药d=3.2000（mm/h）乙药d=5.0000（mm/h）

=1.9322（mm/h）S

=2.9810（mm/h）

=0.6110（mm/h）S

=0.9428（mm/h）

n=10n=10

Ho：μ

=0Ho：μ

：μ

≠0H

：μ

≠0

α=0.05α=0.05

（甲药）

=d/S

=3.2000/0.6110=5.237

（乙药）

=d/S

=5.0000/0.9428=5.303



=9，查t界值表，得P＜0.001，按α=0.05水准，拒绝Ho，接受H1

，故可认为

甲、乙两药均有效。

（2）甲，乙两药的疗效有无差别？

由表中资料分别求得治疗前后差值（见表3-8），再作两组比较。

0：

甲乙两药疗效相同

1：

甲乙两药疗效不同α=0.05



=18，查t界值表，得0.20＞P＞0.10，按α=0.05水准，不拒绝Ho，尚不能

认为甲乙两药疗效有差别。

3.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验，测得稀释倍数如

下，问两组的平均效价有无差别？

标准株（11人）116

水生株（9人）100

由题知：该资料服从对数正态分布，故得：

标准株水生株

n=11n=9

1lgxX=2.79362lgxX=2.2676

1lgxS

=0.45202lgxS

=0.2355

（1）两组方差齐性检验：







=0.05

F=684.32355.0/4520.0/2222

小大

=10V

=8F

0.05(10,8)

=4.30

查附表3，得P＞0.05，按α=0.05水准，不拒绝Ho，可以认为两总体方差齐。

（2）两组均数比较；

两总体几何均数相等

两总体几何均数不等

α=0.05

查t界值表，得0.01＞P＞0.005，按α=0.05水准，拒绝Ho，接受H

，故可认为钩

端螺旋体病人的血清用标准株和水生株作凝溶试验，前者平均抗体效价高于后者

4.表3-9为抽样调查资料，可做那些统计分析？

表3-9某地健康成人的第一秒肺通气量（FEV1）（L）

FEV

人数

男女

2.0～14

2.5～38

3.0～1123

3.5～2733

4.0～3620

4.5～2610

5.0～102

5.5～30

6.0～6.510

合计118100

（1）统计描述。

由上表可见，男性调查118人，第1秒肺通气量分布为2.0～6.5，高峰位于4.0～

4.5组段内，以中间频数分布最多，两侧逐渐减少，左右基本对称，其频数分布可

见上表和下图。女性调查100人，第1秒肺通气量分布为2.0～2.5，高峰位于3.5～

4.0组段内，以中间频数分布最多，两侧逐渐减少，且左右大体对称，频数分布可

见表3-9和图3-1。

图3-1某地健康成人第一秒肺通气量（FEV

）（L）分布

由上表和图可见，男性分布范围较宽，右侧尾部面积向外延伸两个组段，高峰

位置高于女性，向右推移一个组段。

（2）计算集中与离散趋势指标，并对两组进行比较。

Ho：男女间第1秒肺通气量总体均数相同

：男女间第1秒肺通气量总体均数不同

α=0.05

男性：n=118

X=4.2373s1

=0.6902

女性：n=100

X=3.7250s2

=0.6258

1212121

///)(/)(nsnSXXxxsXX

=(4.2373-3.7250)/100/6258.0118/6902.022

=5.624

2.02.53.03.54.04.55.05.56.06.5

女男

查t界值表，v=∞，得P＜0.001，按α=0.05水准，拒绝Ho，接受H

，故可认为

男女间第1秒肺通气量均数不同，男高于女。

（3）根据上述分析结果，分别确定95%参考值范围。

男性第1秒肺通气量单侧95%参考范围下限为：

suX

05.0

=4.2373-1.6450.6902=3.16(L)

即可认为有95%的男性第1秒肺通气量不低于3.16（L）

女性第1秒肺通气量单侧95%参考范围下限为：

suX

05.0

=3.7250-1.6450.6258=2.69(L)

即可认为有95%的女性第1秒肺通气量不低于2.69（L）

5.某医师就表3-10资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前,后

（接种后两月）血清抗体（黄疸出血型）的变化。

表3-10328例血清抗体滴度及统计量

抗体滴度的倒数

06401280

sxs

免疫前人数29376.1111.76.17

免疫后人数2523411.9470.525.90

t=(411.91-76.1)/2217.69.25=12.6＞3,查t界值故P＜0.01,说明接种后血

清抗体有增长。试问：

（2）本例属于何种类型设计？

本例属于自身配对设计。

（3）统计处理上是否妥当？

统计处理上不妥当，因为：①在整理资料过程中，未按配对设计整理，而是拆开

对子按成组设计整理，失去原设计的意义。②统计描述指标使用不当，血清浓度

是按倍比稀释，不适合计算算术均数、标准差、因为有零值，也不宜计算几何均数。

对现已整理好的资料，可计算中位数表示平均水平，用四分位数间距表示离散趋势。

③假设检验因本资料不宜计算均数，故对均数进行t检验当然是不妥当的。

6．152例麻疹患儿病后血清抗体滴度倒数的分布如下，试作总体几何均数的点值估计

和95%区间估计。

滴度倒数282565121024合计

人数2431152

以滴度倒数X的对数值求得X1gx=1.85965，Slgx=0.44245,n=152,则点值

估计G=lg-11.85965=72.39

患儿病后血清抗体滴度倒数总体均数95%可信区间为

lg-1(Xlgx+1.96Slgx/√n)

=lg-1(1.85965+1.96×0.44245/√152)

=lg-1

=61.5～85.11

7．某医院对9例慢性苯中毒患者用中草药抗苯1号治疗：

(1)得表白细胞总数（×109/L），问该药是否对患者的白细胞总数有影响？

表3-119例慢性苯中毒患者治疗前后的白细胞总数

病人号治疗前治疗后d1

16.04.21.8

24.85.4-0.6

35.06.3-1.3

43.43.8-0.4

57.04.42.6

63.84.0-0.2

76.05.90.1

83.58.0-4.5

94.35.0-0.7

该药对患者的白细胞总数无影响，即μ

该药对患者的白细胞总数有影响，即μ

≠0

α=0.05

求得（前—后）差值d

经计算得：

d=0.3556S

=1.9951n=9

534.0)9/9551.1/(3556.0)//(0nsd



=8查附表2，t界值表，得P＞0.5，按α=0.05水准，不拒绝Ho，尚

不能认为该药对患者的白细胞总数有影响。

（2）同样得治疗后血小板比治疗前每人平均增加37.8×109/L，并算得

t=4.1，问该药是否对患者的血小板有影响？

该药对患者的血小板无影响，即μ

该药对患者的血小板有影响，即μ

≠0

α=0.05

d=37.8t=4.1



查附表2，t界值表，得0.005＞P＞0.002，按α=0.05水准，拒绝Ho，

接受H

，故可认为该药对患者的血小板有影响，可增加患者血小板。

（3）综合上述结果能否提出进一步研究意见/综合上述结果，提出以下建议：

①在此项研究中，从t检验结果来看，血小板治疗前后变化有意义，

而白细胞则无意义，可补充计算两项指标的95%可信区间，结合专

业知识，分析治疗前后指标差数有无实际意义。

②如有可能扩大样本，追踪观察该药对苯中毒患者的远期疗效

第四章方差分析

答案

填空题

1.各样本是相互独立的随机样本，各样本来自正态总体，

处理组总体方差相等（方差齐性）

2.总变异、组内变异、组间变异SS总=SS组间+SS组内

3.q检验（又称Newman-Keuls法）

4.V总=SS组间+SS组内

是非题：

1.×2.√3.×4.√5.×

单选题：

1.B2.D3.E4.B5.C6.A7.C8.C

计算题:

1.某湖水不同季节氯化物含量测定值如表2-4所示，问不同季节氯化物含量有无差

别？

表4-1：某湖水不同季节氯化物含量（mg/L）

春夏秋冬

22.619.118.919.0

22.822.813.616.9

21.024.517.217.6

16.918.015.114.8

20.015.216.613.1

21.918.414.216.9

21.520.116.716.2

21.221.219.614.8∑

∑Х

167.9159.3131.9129.3588.4

888832

X20.9919.9116.4916.168.39

∑Х2

3548.513231.952206.272114.1111100.84

.52988.55554.50983.47125.0166

（1）多组均数间比较：

表1:方差分析表

变异来源SSvMSF

总变异281.63531

组间变异141.170347.0579.380

组内变异140.465285.017

查F界值表，得P＜0.01，按0.05水准，拒绝H0，接受H1，故可认为不同季

节湖水中氯化物含量不同或不全相同。

（2）各组均数间两两比较

H0：μ

=μ

H1：μ

≠μ

α=0.05

表2四个样本均数顺序排例

组别春夏秋冬

X20.9919.9116.491

位次1234

表3四组均数两两比较q检验

对比组两均数之差组数q值P值

1与44.8346.099<0.01

1与34.5035.682<0.01

1与21.0821.364>0.05

2与43.7534.735<0.01

2与33.4224.319<0.01

3与40.3320.417>0.05

春与夏、秋与冬湖水中氯化物含量P＞0.05，按α=0.05水准不拒绝Ho，即尚不能

认为春与夏、秋与冬季湖水中氯化物含量有差别。除这两对比组外，其它4组均P

＜0.01，按α=0.05水准，拒绝Ho，接受H1，即可认为春夏两季湖水中氯化物含

量高于秋冬两季。

2．试就表4-2资料说明大白鼠感染脊髓灰质炎病毒后，再作伤寒或白日咳预防接种是

否会影响生存日数？

表4-2各组大鼠接种后生存日数

伤寒百日咳对照

568

769

8710

9810

10911

10912

111012

111014

121116∑

∑Хij9284112288

ni10101030

X9.28.411.29.6

∑2

X88673213062924

s4.4002.9335.7334.3553

解Ⅰ：假定生存日数服从正态分布

（1）方差齐性检验：

Ho：三总体方差齐即2



：三总体方差不等或不全相等。

α=0.05

)/()1(22kNnss

iic

9（4.4+2.933+5.733）/（30-3）=4.3553

=0.9461

v=2，查附表9，X2界值表，得0.75＞P＞0.50，按α=0.05水准，不拒绝

Ho，故可认为三组资料总体方差齐。

（2）三组均数比较（表4-5）

Ho：大白鼠感染脊髓灰质炎病毒后，再接种伤寒或百日咳菌苗生存日数相等。

：大白鼠感染脊髓灰质炎病毒后，再接种伤寒或百日咳菌苗生存日数不等或不全

相等

α=0.05

C=（∑∑Χ

）2/n=2882/30=2764.8

总

=∑∑Χ

2－C=2924－2764.8=159.2

组间

=∑（∑Χ

）2/ni-C

=[922+842+1122]/10－2764.8

=41.6

组内

=SS

总

－SS

组间

=159.2－41.6=117.6

表4-5方差分析表

变异来源SSvMSF

总变异159.229

组间变异41.6220.84.776

组内变异117.6274.3556

查附表4，得0.05＞P＞0.01，在α=0.05水准上，拒绝Ho，接受H

，故

可以认为大白鼠感染脊髓灰质炎病毒后，在接种伤寒或百日咳菌苗对生存

日数有影响。

（3）均数间多重比较：

Ho：任一组与对照组总体均数相同

：任一组与对照组总体均数不同

α=0.05

伤寒与对照组比较

=（11.2－９.２）／)10/110/1(3556.4

=2/0.933338

=2.1428

v=27，得0.05＞P＞0.02，按α=0.05水准，拒绝Ho，接受H

，故可认为接

种伤寒菌苗组较对照组生存日数减少。

百日咳与对照组比较

v=27，查附表2，得0.01＞P＞0.005，按α=0.05水准，拒绝Ho，接受H

，

可以认为接种百日咳菌苗组较对照组生存日数减少。

3．研究酵解作用对血糖浓度的影响，从8名健康人中抽取血液并制备了血滤液，没一

个受试者的血滤液又分成4份，再随机地把4份血滤液分别放置0,45,90,135分钟，

然后测定其中血糖浓度（mmol/L）

（1）4组血滤液方差齐性检验：

Ho：不同放置时间血滤液所含血糖浓度总体方差相等，

即2



：不同放置时间血滤液所含血糖浓度总体方差不等或不全相等

α=0.05

方差齐性检验方法同本例X2=1.16847

v=k－1=4－1=3，查附表9，X2界值表，得0.90＞P＞0.75，按α=0.05水

准，不拒绝Ho，可以认为放置不同时间血滤液所含血糖浓度总体方差齐。

表4-3放置不同时间血滤液所含血糖浓度（mmol/L）

受试者编号放置时间受试者小计

04590135

15.275.274.494.6119.64

25.275.224.884.6620.03

35.885.835.385.0022.09

45.445.385.275.0021.09

55.665.445.384.8821.36

66.226.225.615.2223.27

75.835.725.384.8821.81

85.275.115.004.4419.82

ΣΧ

44.8444.1941.3938.69169.11

88888

X5.60505.52385.17384.83635.2847

∑2

X252.1996245.0671215.0527187.5585899.8779

s0.12450.13890.13020.06340.1143

（2）配伍组设计方差分析：

处理：Ho：不同放置时间血滤液所含血糖浓度相同

：不同放置时间血滤液所含血糖浓度不同或不全相同相同

α=0.05

配伍：Ho：8位受试者血液所含血糖浓度相同

：8位受试者血液所含血糖浓度不同或不全相同

α=0.05

С=（ΣΣⅩ

）2/n=169.112/32=893.6935

总

=ΣΣⅩ

2-С=899.8779-893.6935=6.1844

放置时间

bij

2)(

=（44.842+44.192+41.392+38.692）/8-893.6935

=2.98524

受试者

=CXk

2)(/1

=1/4（19.642+20.032+22.092+21.092+21.362+23.272

+21.812+19.82）-893.6935

=2.79093

误差

=SS

总

－SS

放置时间

－SS

受试者

=6.1844－2.98524－2.79093=0.40832

方差分析表

变异来源SSvMSF

总变异6.184431

放置时间2.9852430.9950851.189

受试者2.7909370.3987020.510

误差0.40823210.01944

查F界值表F0.05(3,21)=3.07F0.01(3,21)=4.87

F0.05(7,21)=2.49F0.01(7,21)=3.64

放置时间受试者间均P＜0.01，按α=0.05水准，均拒绝Ho，接受H

，故

可认为不同放置时间、不同受试者间血滤液所含血糖浓度不同或不全相

同。

（3）不同放置时间血滤液所含血糖浓度均数间多重比较，采用多个实验组

与一个对照组均数间两两比较。

①Ho：放置45分钟与0分钟血滤液所含血糖浓度相同

：放置45分钟与0分钟血滤液所含血糖浓度不同

α=0.05

=0.0812/0.06971=1.16476

v=n-k=32-4=28，查附表2，t界值表，得0.40＞P＞0.20，按α=0.05

水准，不拒绝Ho，尚不能认为放置45分钟与0分钟血滤液血糖浓度总均

数有差别。

②Ho：放置90分钟与0分钟血滤液所含血糖浓度相同

：放置90分钟与0分钟血滤液所含血糖浓度不同

α=0.05

=0.4312/0.0697=6.1853

v=28，查附表2，t界值表，得P＜0.001，按α=0.05水准，拒绝Ho，

接受H

，可认为放置90分钟较0分钟血滤液所含血糖浓度减少。

③Ho：放置135分钟与0分钟血滤液所含血糖浓度相同

：放置135分钟与0分钟血滤液所含血糖浓度不同

α=0.05

=0.7687/0.0697

=11.0265

v=28，查附表2，t界值表，得P＜0.001，按α=0.05水准，拒绝Ho，

接受H

，故可认为放置135分钟较0分钟血滤液所含血糖浓度减少。

4．某医师为研究人体肾上腺皮质HSD3(羟基类固醇脱氢酶)活性在四个季节中是

否有差别,采用分光光度计随机测定了部分研究对象,数据见表2.8,请做统计分析.

表4-4四个季节的人体肾上腺皮质HSD3活性

季节nXS

春季420.780.13

夏季400.690.22

秋季320.680.14

冬季360.580.20

解:本题仅给出分析思路及主要结果

1.采用完全随机设计资料的方差分析:

(1)由公式



可推得XnX

由方差公式可推得

)1(

)(

2



(2)计算SS

总

组间

组内

总

=5.365,SS

组间

=0.777SS

组内

=4.588

列出方差分析表

方差分析表

变异来源SSvMSF

总变异5.365149

组间变异0.77730.25908.248

组内变异4.5881460.0314

(4)确定P值,判断结果

查方差分析表,得P<0.01,在



=0.05水准上,拒绝Ho,接受H

,可以认为四个

季节人体肾上腺皮质

HSD3

(羟基类固醇脱氢酶)活性不同或不全相同.

2.进一步作均数间的多重比较分析(略)

第五章相对数

答案

填空题

1.比重和分布，频率与强度

2.率

3.消除混杂因素对结果影响

4.率，构成比，相对比

5.率的抽样误差δx

是非题：

1.√2.×3.√4.×5.√6×.7.×8.×9.×10.×

11.×

单选题：

1.D2.E3.A4.D5.A6.B7.D8.A9.D10.D

11.B12.E13.A14.C15.E16E.17.E18.B19.A20.A

21.C22.D

计算题：

1.表5-1（1）～（4）栏资料宜计算那些相对数指标？试对围产儿在围产期死亡的主

要因素作初步分析。

表5-1不同体重，孕周，产次的围产儿死亡情况分析

因素分组出生数死亡数死亡构成比（%）死亡率（%）

（1）（2）（3）（4）（5）（6）

体重（g）1000～1.18119.91

2500～6.835.84

4000～5373481.998.93

合计2.0011.54

孕周（周）<38.55113.32

38～3.469.32

42～140132445.9917.41

合计2221284075100.0018.35

产次（次）62.8014.55

25159673923.9214.32

372562598.3835.69

41786822.6545.91

≥5954692.2372.33

合计00.0015.85

先就上述资料计算了上表（5）～（6）栏两类指标。

由表中死亡率可知；体重低于2500g组围产儿死亡率约为2500g组的20倍；孕

周＜38周组围产儿死亡率约为38周组的12倍；随着产妇的产次增加，围产儿死

亡率也逐渐升高。

由表中死亡构成比可知：半数以上的围产儿死亡率集中在体重1000～2500g组和

孕周＜38周组。为降低围产儿死亡率，对体重偏低，不足月妊儿及多产次产妇应

加强产前保护。

2.表5-2为一抽样研究资料

（1）填补空白数据，见下表（）内。

表5-2某地各年龄组恶性肿瘤死亡情况

年龄人口数死亡总数其中恶性恶性肿瘤死亡恶性肿瘤死年龄别死

(岁)肿瘤死亡数占总死亡的(%)亡率(1/10万)亡率(%0)

(1)(2)(3)(4)(5)=(4)/(3)6)=(4)/(2)(7)

0～82920（138）42.90（4.82）（1.644）

20～（46638）63（12）19.0525.73（1.351）

40～2816117242（24.42）（149.142）（6.108）

60～（9371）（342）32（9.63）（341.479）（36.496）

合计167.59（53.863）（4.279）

（2）根据最后（5）（6）（7）三栏结果作简要分析

由表中第（5）栏可知：40～岁组恶性肿瘤死亡占总死亡比重最高，近1/4；20～

岁组次之，占19.5%；60～岁组恶性肿瘤死亡人数最多，但仅占9.36%；0～岁组恶性

肿瘤死亡占总死亡比重最底，仅占2.90%由表中第（6）栏可知：恶性肿瘤的年龄别死

亡随年龄的增大而增加，以60～岁组为最高，为341.479/10万。故可认为恶性肿瘤对

老年人危害最大，应引起足够的重视。由表中第（7）栏可知：年龄别死亡率以40岁

以下最低，以后随年龄的增加而增加，60岁以后高达36.496‰。

（3）试估计“0～”岁年龄组恶性肿瘤死亡率和年龄别死亡率的可信区间。

0～岁组恶性肿瘤死亡率的可信区间：死亡数为4，查poisson分布u的可信区间，

可信区间为1.0～10.2。所以恶性肿瘤死亡率的95%可信区间为：

（1.0/82920～10.2/82920）=（1.206～12.301）/10万

0～岁组年龄别死亡率的可信区间，按式：

（4）试比较“20～”与“40～”岁组恶性肿瘤死亡率有无差别。

Ho：20～与40～岁组恶性肿瘤死亡率相等，即π

=π

：20～与40～岁组恶性肿瘤死亡率不相等，即π

≠π

α=0.05

本例：n

=28161x

=42n

-x

=28119

=46638x

=12n

-x

=46626

合计:747995474745

X2=37.07

查X2界值表，得P＜0.005在α=0.05的水准上，拒绝Ho，接受H

，故可认为20～岁

组与40～岁组恶性肿瘤死亡率有差别。

3.试就表5-3资料分析比较甲乙两医院乳腺癌病人手术后的五年生存率。

表5-3甲乙两医院乳腺癌病人手术后五年生存率

标化（甲+乙医院合计为标准）

腋下淋巴标准病甲医院乙医院

结转移例数原生存率(%)预期生存人数原生存率(%)预期生存人数

NiPiNiPiPiNiPi

(1)(2)(3)(4)=(2)(3)(5)(6)=(2)(5)

无34577.77268.3171.67247.26

有79363.38502.6050.60401.26

合计1138（∑Ni）64.24770.91（∑NiPi）67.10648.52

甲医院乳腺癌手术后五年标化生存率



'×100%=

1138

91.770

×100%=67.74%

乙医院乳腺癌手术后五年标化生存率



'×100%=

1138

52.648

×100%=56.99%

因为甲乙两医院有无腋下淋巴结转移的病型构成不同，故标化后，甲医院乳腺癌

手术后五年生存率高于乙医院，校正了标化前甲医院低于乙医院的情况。

2.为了解某乡钩虫感染情况，随机抽查男200人，感染40人，女150人，感染20人。

（1）该乡男性感染率是否高于女性？

Ho：男女性的钩虫感染率相同，即π

男

=π

女

：男性的钩虫感染率高于女性，即π

男

＞π

女

单侧α=0.05

=40/200=0.2P

=20/150=0.1333

=(X

)/(n

)=60/350=0.1714

)n/1n/1)(P1(P

21CC





6385.1

)150/1200/1)(1714.01(1714.0(

1333.02.0







查t界值表，υ=∞，得单侧0.10＞P＞0.05，按α=0.05水准，不拒绝Ho，尚不

能认为该乡男性钩虫感染率高于女性。

（2）若对该乡居民作驱钩虫治疗，需要按多少人准备药物（全乡人口男7253人，女

7109人）？

计算该乡钩虫感染率的95%可信区间：

=(13.19～21.09)%

14362×13.19%=1894（人）14362×21.09%=3029（人）至少需要按1894人，

最多按3029人准备药物。

3.抽样调查某企业2839名职工高血压病,结果见表.据此,某医生认为：①该企业高血

压发病率为8%，并随年龄递增，其中40岁以上患者占全部病例的90.3%，60岁以

上者发病率为100%。②高血压发病与性别有关，男性为10.2%，女性为4.5%，男

性明显高于女性（P<0.01）。以上分析是否妥当，试加评述。

表5-4男、女年龄组高血压病例分布

男性女性

年龄组——————————————————————————————

受检人数病例数发病率（%）受检人数病例数发病率（%）

20～33351.571240.6

30～30141.314296.3

40～5176412.41852714.6

50～5769316.061914.8

60～1212100.0

合计173917810.21100494.5

答：该分析不正确。因为:

（1）高血压患病率为8%，而不是发病率。原文中60岁以上的发病率是100%，应

为患病率，且由于60岁以上受检人数太少，不宜计算相对数。

（2）由于男女性受检人数的年龄构成不同，不能直接比较两总患病率，对男女合

计进行假设检验更无意义。由于各年龄组患病率出现明显交叉，如：20～和

50～岁组的男性患病率均高于女性，而30～和40～岁组的男性患病率均低

于女性。此资料宜直接比较各年龄组的患病率，而不宜使用标准化。

4.某产院拟分析畸形儿与母亲分娩年龄的关系，检查了新生儿4470例，畸形儿116

例，得以下资料。据此得出结论：“母亲年龄在24～29岁时，畸形儿最多，占总数

的92.2%，符合一般规律”。

母亲年龄（岁）2282930313233合计

畸形儿例数9133111116

%0.861.712.116.420.715.516.411.22.60.860.860.86100.00

（1）以上结论是否合理？为什么？以上结论不合理，不能以比代率。

（2）若要达到作者之目的，应计算什么相对数指标较好？如何计算？

若要达到作者的目的，应计算产妇年龄别畸形儿发生率。

某年龄（组）畸形儿发生率=

%100

死胎数死产该年龄组活产

胎婴儿数某年龄组先天性畸形的

7.某市1971～1981年乙型脑炎发病率如表5-5，试作动态分析

表5-5某市1971～1981年乙型脑炎发病率动态分析

年份发病率绝对增长量发展速度（%）增长速度（%）

（1/10万）累计逐年定基比环比定基比环比

197120.52——100100——

19726.31-14.21-14.2130.7530.75-69.25-69.25

19731.87-18.56-4.449.1129.64-90.89-70.36

19743.07-17.451.2014.96164.17-85.0464.17

19751.08-19.44-1.995.2635.18-94.74-64.82

19761.38-19.140.306.73127.78-93.2727.78

19772.29-18.230.9111.16165.94-88.8465.94

19782.31-18.210.0211.26100.87-88.740.87

19792.47-18.050.1612.04106.93-87.966.93

19802.76-17.760.2913.45111.74-86.5511.74

19812.94-17.580.1814.33106.52-85.676.52

本资料从1971年到1974年，发病率呈下降趋势，1975年开始呈上升趋势，

故以1975年为基期计算。

平均发展速度=%2.11808.1/94.26

平均增长速度=平均发展速度－1=1.182－1=18.2%

动态分析：从绝对增长量看，各年乙型脑炎发病率均低于1971年，10年内

共降低17.58/10万。总的来看发病率呈下降趋势，但降低的速度是不平衡的；

从发展速度和增长速度来看，在最初的1971～1975年是基本下降的，以后又略

有回升现象。在1975年至1981年期间发病率平均发展速度为118.2%，平均增长

速度为18.2%。

8.从表5-6资料，判断某工厂肺癌发生率是否比一般人群高？

表5-6某工厂肺癌发生率

分组某厂一般人群

人数肺癌人数肺癌发生率（1/万）

吸烟70054.5

不吸烟30011.5

Ho：μ=μo

：μ＞μo

单侧α=0.05

μo吸烟=n

=700×0.00045=0.315

μo不吸烟=n

=300×0.00015=0.045

吸烟者的肺癌发生人数X≥5累计概率：

P=1-[p（0）+p(1)+p（2）+p（3）+p（4）]

P（0）=e-μ=e-0.315=0.7298

P（1）=P（0+1）=P（0）×μ/（0+1）=0.7298×0.315/1=0.2299

P（2）=P（1+1）=P（1）×μ/（1+1）=0.2299×0.315/2=0.0362

P（3）=P（2+1）=P（2）×μ/（2+1）=0.0362×0.315/3=0.0038

P（4）=P（3+1）=P（3）×μ/（3+1）=0.7298×0.315/4=0.000299

P=1-（0.7298+0.2299+0.0362+0.0038+0.000299）=0.000001，按α=0.05水准

拒绝Ho，接受H

，故可认为某工厂吸烟的肺癌发生率明显高于一般人群

不吸烟组：Ho：μ=μo

：μ＞μo

单侧α=0.05

不吸烟者的肺癌发生人数X≥1的累计概率：

P=1-P（0）

P（0）=e=e-0.045=0.956

P=1—0.956=0.044，按α=0.05水准拒绝Ho，接受H

，故可认为某工厂不吸烟的

肺癌发生率高于一般人群。

9.就表5-7资料如何比较甲乙两厂某工种某病患病率

表5-7甲，乙两厂某工种某病患病率

工龄甲厂乙厂

（岁）工人数患者患病率（%）工人数患者患病率（%）

＜3400123.0010011.00

≥31001010.004007218.00

合计500224.405007314.60

从表中可以清楚看到≥3的工龄组的患病率乙厂高于甲厂，＜3岁组甲厂高于乙厂，

呈现交叉现象。甲厂以患病率低的3年以下工人为主，乙厂则以患病率高的工龄

在3年以上的工人为主。这种情况下不能直接比较总患病率，应按不同工龄组进

行比较

10.设某病患者的自然康复率为30%,分别求10个患者中自然康复1人及以下,8人以

上的概率

本例π=0.30，1-π=0.7，n=10。依题意10名患者中：

（1）康复1人及以下的概率

P（X≤1）=)1()0()(

PPXP

P（0）=0.710=0.02825

P（1）=12106.03.07.0

)!110(!1

)110(



！

P（x≤1）=0.02825+0.12106=0.1493

（2）康复8人及以上的概率。

P（x≥8）=)10(10)9()8()(

ppXp

P（8）=xxn

xX)()1)((

=0014467.03.07.0

)!810(!8

!10

8)810(



P（x+1）=P（X）×











11X

P（9）=p(8)

0001378.0

3.01

3.0

810













P（10）=0.310=0.000005905

则P（x≥8）=P（8）+P（9）+P（10）=0.00159

当某病自然康复率为30%时，10名患者中1人及1人以下康复的概率为0.14931，

康复8人及8人以上的概率为0.00159

11.用某型麻疹疫苗接种一批麻疹易感儿，把接种后已阳转者96名作为观察对象，3

年后复查，96名中仍为阳性者为85名，试求该疫苗接种阳转者3年后仍保持阳性

的百分率的95%可信区间

因为nP=85，nq=11，均大于5，n=96＞50，可按正态近似求该疫苗接种3年仍

保持阳转率的95%可信区间。

=0.85540.0637=(82.17～94.91)%

12.用一种新药治疗某种寄生虫病，受试者50人中在服药后1人发生严重反应，这种

反应在此病患者中也曾有发生，但过去普查结果为每5000人仅有一人出现。问

此药是否提高了这种反应生率？

Ho：服药后的反应率与普查时的反应率相等，即受试者每50人服药后平均反应人

数为μo

：服药后的反应率高于普查时的反应率，即μ＞μo

单侧α=0.05

本例n=50，πo=1/5000=0.0002，μo=nπo=50×0.0002=0.01，样本例数为50时，

抽得样本严重反应人数X≥1的概率：

P=1-P（0）P（0）=99.001.0ee

P=1-0.99=0.01

今P=0.01，按α=0.05，拒绝Ho，接受H

，故可认为此新药能提高了这种反应的

发生率。

13.同一水样中，每次抽取1ml置培养皿中，共作10个平板培养，共数得菌落146个，

试估计该检样菌落数的95%可信区间。

X=146（个），X＞50，用正态近似法求该检样本菌落数的95%的可信区间为：

X±)(68.169~32.12214696.1146Xu

个

14.某疫苗预防接种后，进行有关的非传染性疾病流行病学考核，结果如下：接种组

与对照组各调查10万人，接种组发病22人，对照组发病36人。试问两组发病

率有无差别？

Ho：两组发病率相同，即μ

=μ

：两组发病率不相同，即μ

≠μ

α=0.05

本例人36



=22人

8383.1

3622

2236

21











查附表2，t界值表，υ=∞，得0.1＞P＞0.05，在α=0.05的水准上，不拒绝

Ho，尚不能认为两组发病率有差别。

15.甲乙两市分别用抽样调查了解已婚妇女宫颈癌的患病情况，甲市调查1万人，患者

82例，乙市调查2万人，患者102例。问甲乙两市宫颈癌患病率有无差别？

Ho：两市已婚妇女宫颈癌患病率相等，即μ

=μ

：两市已婚妇女宫颈癌患病率不相等，即μ

≠μ

α=0.05

X=82/10000=0.0082，

X=102/20000=0.0051

20000/0051.010000/0082.0

0051.00082.0

2211











nXnX

=2.9899

本题也可以万人为单位，计算更为简单：

u=9899.2

2/5182

5182







查附表2，t界值表，υ=∞，得0.005＞P＞0.002，在α=0.05的水准上，拒绝Ho，

接受H

，故可认为两市妇女子宫颈癌患病率的差别有显着性，甲市已婚妇女子宫

颈癌患病率高于乙市。

16.观察某种防治细菌性痢疾（菌痢）措施的效果，结果如表3-6。问能否据此认为该

措施有效？

表5-8两组人群菌痢发病率的比较（1979年）

分组人数菌痢例数(无菌痢数)发病率(‰)

试验组41182140975.1

对照组521772514513.8

合计93359392429.96

Ho：π

=π

：π

≠π

单侧α=0.05

)/1/1)(1(

nnPP





204.4

)5217/14118/1)(00996.01(00996.0

0138.00051.0







查附表2，t界值表，υ=∞，得P＜0.005，按α=0.05的水准，拒绝Ho，接受H

，

故可认为实验组和对照组的菌痢发病率有差别，实验组的发病率低于对照组，即该

措施有效。

17.把某肿瘤新发病例按住址点在一张地图上，又将地图划分成许多面积相等的小方

格，再分别统计发病数0，1，2，……及相应的方格数，对此资料作Possion分布

拟合优度的X2检验，若P＜0.05，就可认为此病在人群中的分布不随机，可能有

聚集性。你认为如何？

答：对此资料作Poisson分布拟合优度的X2检验，若P＜0.05按α=0.05水准，

拒绝Ho，接受H

，可认为此资料不服从Poisson分布，也即可以认为此病在人群

中不呈随机分布，再综合考虑环境（地形、地貌）遗传等资料，结合专业知识确

定有无聚集性。

18.某乡有人口5000人，已知血吸虫粪检阳性率下降至5%左右。血防站准备进行一次

血吸虫感染的普查，拟先将每10人粪便作为一个初筛的混合样本，混合样本血吸

虫卵阴性，则该10人均作阴性；混合样本阳性，再对该混合样本的10人粪便逐

人复查。问此法比一般的逐人粪便检查会减少多大的工作量？

设：k=每组混合样本例数；P=粪检血吸虫卵阳性率；q=阴性率=1-p；

N=全部受检人数；N/k=混合样本数，即组数

（1）计算每组平均检验次数。

由二项分布理论可知：

概率检验次数

混合样本内粪检q.q.q…q=qk1

全部为阴性

混合样本内粪检1-qkk+1

至少有1例阳性

一组平均检验次数=（qk×1）+（1-qk）（k+1）=k-kqk+1（1）

（2）计算全部检验期望数。

全部检验期望数=（N/k）（k-kqk+1）=N（1-qk+1/k）（2）

本例已知：N=5000，K=10，P=0.05，q=1-p=0.95，代入试（2）

全部受检期望数=5000×（1-0.9510+1/10）=2506.32

比一般逐人检查减少工作量：5000-2506.32=2493.68，减少工作量的百分比为：

2493.68/5000=49.87%。

19.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查，据已掌握的情况，

将全县各乡分为好、较好、差三类，各随机抽取1/10的学龄前儿童作调查，结果

如表5-9，试估计该县百白破疫苗接种率的95%可信区间。

表5-9某县三类乡百白破疫苗接种率调查结果

类别人数抽样人数接种率

好73717230.8174

较好1489914780.6969

差93089300.3022

合计305783131

本题为求按比例分配的分层抽样中总体率的可信区间，首先计算接种率及

其标准误。

（1）p=[ΣΝ

]/Ν=1/31578[7371×0.8174+14899×06969+9308×0.3022]

=19221.0461/31578=0.608685

（2）NnppNnNs

iiiiip

/)1/()1()[(/1(2

=)}1930/(6978.03022.0)[9308/9301(

9308)]1723/(1826.08174.0)[7371/7231(

7371

=0.007520

该率不接近于0或1，一般认为服从二项分布。因n=3131，较大，可用

正态近似法计算其可信区间。

95%CI：P±1.96sp=0.608635+1.96×0.007520=（0.5939，0.6234）

20.为了解某县某病感染率，现从全县125个村民组（共3万人）中随机抽出10个村

民组，对该10个村民组的全部人口进行了调查，结果如下，试据此估计此县农村

居民感染率

村民组合计

人数493503702386

感染人数497

本例采用整群抽样作总体率的点估计和区间估计。

按正态近似原理计算：已知：K=125，k=10

点估计：p=（K/Nk）（Σα

）

=（125/30000/10）×（797）=0.3321

=0.03355

95%?可信区间：P±1.96sp=（0.2663，0.3979）

99%可信区间：P±2.58sp=（0.2455，0.4187）

第六章χ2检验

1.合理并组

2.确切概率法（精确X2.0）

3.n≥401≤T＜5

是非题：

1.√2.√3.×4.×5.×6.√7.√

单选题：

1.A2.A3.B4.D5.A6.E7.C8.E9.A10.B

11.D12.D13.B14.A15.E16.C17.D18.C19.A20.A

21.E

问答题：

1.X2检验适用于解决那些问题？对资料的设计类型和应用条件有何不同要求？

（1）X2检验适用于：①两个及两个以上的率或构成比的比较；②计数资料

两因素间的相关关系；③频数分布的拟合优度检验。

（2）对资料的设计类型和应用条件。

1）四格表的X2检验：

基本公式

)(



T＞5且n＞40

专用公式

))()()((

)(2

dbcadcba

nbcad







校正公式

))()()((

)2/(2

dbcadcba

nnbcad







1＜T＜5且n＞40

或

)5.0(



当T＜1或n＜40时，可使用确切概率计算法直接计算概率，应用时注意区分单、

双侧检验。双侧检验。双侧检验取两侧累积概率，单侧检验只取一侧累积概率。

2）行×列（R×C）表资料的X2检验：

基本公式与四格表基本公式相同。

专用公式：

)1(

2

可使用实际频数计算X2。

适用条件①行×列表不宜有1/5以上的格子的理论频数小于5，或有一格理

论频数小于1。②当多个样本率（或构成比）比较的X2检验，拒绝检验假设，

只能认为各总体率（或构成比）之间总的有差别，但不能说明彼此间都有差别

或某两者间有差别，若要进一步解决此问题，可用X2分割法。③对单向有序

列

联表，X2检验只说明各处理组的效应在构成比上有无差别。

3）列联表资料的X2检验：

R×C列联表公式：与R×C（行×列）表相同，但检验假设不同，R×C

列联表用于检验有无关联，而R×C（行×列）表用于多个率或构成比的比较。

适用条件与行×列表适用条件①相同。

2×2列联表或配对资料X2检验，检验两个处理有无差别。







)(

b+c＞40

或校正公式







)1(

b+c＜40

检验两种处理间有无相关，公式同四格表所用公式

4）频数分布拟合优度的X2公式

)(



适用条件遇有理论频数小于5时，可与相邻组合并。

2.X2检验的基本思想是什么？

X2检验的基本思想是实际数与理论编数的吻合程度，它是根据检验假设来确定的，

如作两样本率的比较，我们先假设两组的总体率相同，均等于两组合计的总率，如

果检验假设成立，则实际数与理论数之差一般不会很大。出现很大的X2值的概率是

很小的若PX则没有理由

拒绝它

3、四表格资料在何种情况下需要进行校正？为什么？

在1≤T＜5n≥40时，需要计算校正X2

推断统计量X2时是用一种连续概率分布（X2分布）作为对观测频数概率分布的近似，

为改善此近似提出了一个修正，即取平方之前将正偏差（A-T）减0.5，负

偏差加0.5，这样使X2值降低，校正后的概率更接近确切的概率。

4、行X列表X2检验的注意事项有哪些？

（1）X2检验要求理论数不宜太小，否则将导致分析的偏性，一般认为行X列表中不宜

有1/5以上格子的理论频数小于5，或有一个理论数小于1。

对理论数频数大小有三种处理方法：

①最好增加样本例数以增加理论频数

②删去上述理论频数太小的行或列

③将太小理论频数所在行或列与性质相近的邻行邻列的实际频数合并。

后两法可能会损失信息，也会损失样本的随机性，不同的合并方式有可能影响推断

结论，故不宜作常规方法。

（2）当多个样本率（或构成比）比较的X2检验，结论为拒绝检验假设，只能认为各总

体率（或总体构成比）之间总的来说有差别，但不能说明它们彼此见都有差别，或

某两个间有差别，实际工作中，常常还需要知道各组间比较的情况，若要进一步解

决此问题，不能采用一般四格表的X2检验进行两两比较，因为这会增大犯Ⅰ型错误

的概率，可采用以下方法：

①改变显着水准后的两两比较法（Brunden法）

前已述及，若将多个样本两两构成四格表，用一般的四格表方法会增大Ⅰ型错误，

那么，一种自然的想法就是能否将显着水准适当降低，从而一方面相当于抵消Ⅰ型

误差的增加，一方面又可采用一般的四格表方法处理？改变显着性水准的方法正是

基于这种思想。Brunden法系将检验水准α调整为α

α’=α/2（K-1）（9.10）

式中K为样本数，然后用求得的各四格表的X2值与X2α值比较，从而作出推断，也

就是说，若取α=0.05，K=6（则α’=0.005），则不能用X2

0.05（1）

=3.84为界值，而要

用X2

0.05（1）

=7.88为界值。此外，也可用各四X2检验对应的P值与α’比较而得出结

论。

②改变显着界值的两两比较法：

该法类似于上法，但考虑到了处理组数a，因而更合理，处理组数a是各组按率的

大小排列后，欲比较的两组间包括的组数，表9.1列出了用蒙特卡洛模拟法求出K×2

表分割为非独立的四格表的显着界值。有了此显着界值后，只要用各四格表的X2值

与相应的界值相比即可作出结论。

K×2表分割为非独立的四格表的显着界值

K处理a

23456

33.105.48

5.158.48

43.004.486.48

4.786.539.33

53.053.995.237.23

4.405.707.359.88

63.033.944.706.158.05

4.505.406.558.4510.00

计算题：

1.某医师用甲、乙两药治疗某病，结果如下表，问甲、乙两药疗效有无差别？

表6-7甲、乙两药疗效比较计算表

药物治愈数未治愈数合计

甲291140

乙69473

合计9815113

Ho：两药疗效相同，即π

=π

：π

≠π

α=0.05

min

=15×40/113=5.31且n＞40用公式

))()()((

)(2

2dbcadcba

nbcad







=10.88

查X2界值表，得P＜0.01，按α=0.05的水准拒绝Ho，接受H

，故可认为甲、乙

两药疗效有差别，乙药疗效较好。

2.某卫生防疫站在中小学观察三种矫治近视眼措施的效果，近期疗效数据如表,结论

为“近期疗效要以夏天无眼药水最好，保健操为次，新医疗法最差”。试对此作分

析评价。

表6-2三措施的近期有效率比较

矫治方法有效人数无效人数（合计）有效率（%）

夏天无眼药水518413537.78

新医疗法6263218.75

眼保健操5131827.78

合计6212318533.51

Ho：三组药物近期有效率相等

：三组药物近期有效率不等或不全相等

α=0.05

+498.4)1

12318

6218

522









v=（2-1）（3-1）=2查X2界值表，得0.25＞P＞0.1，按α=0.05的水准不拒绝Ho，

尚不能认为三种措施的近期有效率有差别。

3.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系，资料整理如表。问两者之

间是否存在一定的关系？

表6-3某厂职工冠心病与眼底动脉硬化普查结果分析

眼底动脉硬化冠心病诊断结果合计

正常可疑冠心病

Ⅰ7313692

Ⅱ+Ⅲ1002019139

合计5134431588

注：原表中

3,4

T=6×31/588=0.3163＜1，故将Ⅱ和Ⅲ级合并

（1）解法Ⅰ：本题为双向有序分类变量，可设X为眼底动脉硬化等级，Y为冠心病诊

断结果，X、Y的等级分别为1、2、3。计算Spearman等级相关系数r

=0.2988，

P＜0.05，眼底动脉硬化程度与冠心病诊断结果存在正相关。

（2）解法Ⅱ：列联表X2检验

Ho：冠心病与眼底动脉硬化级别无关

：冠心病与眼底动脉硬化级别有关

α=0.05

31139

44139

513139

100

3192

4492

51392

73222222























-1=58.134

查附表9，X2界值表，得P＜0.005，按α=0.05的水准拒绝Ho，接受H

，故可认

为该厂职工冠心病与眼底动脉硬化级别有关。

4.表6-4用两种方法检查已确诊的乳腺癌患者120名。甲法检出率为60%，乙法检出

率50%，甲乙两法一致的检出率为35%，问：

（1）两种方法何者为优？

表6-4甲乙两法检验结果

乙法甲法合计

+421860

-303060

合计7248120

Ho：两法分不出优劣，即B=C

：两法能分出优劣，即B≠C

α=0.05

b+c=18+30=48＞40

v=1，查附表9，X2界值表，得0.10＞P＞0.05，按α=0.05的水准不拒绝Ho，尚

不能认为检出率有差别

（2）两种方法的检出结果是否有关系

Ho：两法的检出结果无关系

：两法的检出结果有关系

α=0.05

24120/4860

min2,1

Tn＞40用公式

00.5

48726060

120)30183042(2







查X2界值表，得0.05＞P＞0.01，按α=0.05的水准拒绝Ho，接受H

，故可认为

甲、乙两法检出结果有关。

4.经反复多次实践证明，用一般疗法治疗某病的治愈率约为20%。现改用新疗法治疗，

并随机抽取400名该病患者进行治疗，那么这400名患者中至少要多少人治愈才能

判断比一般疗法效果好？此判断发生错误的概率有多大？

Ho：两种疗效法治愈率相同，即

2.0

：2.0

单侧α=0.05

本例n=4002.0

/)1(







解之，nup/)1(

000



=0.2+1.645400/)2.01(2.0=0.2329

X=Np=4000.2329=94（人）

400名患者中至少要有94人治愈才能判断新疗法比一般疗法效果好。此判断可能

发生错误的概率为5%

5.某种化学物质经诱发肿瘤试验，实验组15只白鼠中4只发生癌变，对照组10只白

鼠无一发生癌变（表6-5）。问两组发癌率有无差别？

表6-5某药物肿瘤治疗试验

发癌数未发癌数合计

实验组41115

对照组0（1.6）1010

合计42125

Ho：两组发癌率相等，即π

=π

：两组发癌率不等，即π

≠π

α=0.05

本题n=25＜40，故用四格表的确切概率法公式：

!!!!!

)!()!()!()!(

ndcba

dbcadcba

周边合计保持不变的四格表有（1）～（5）：

取︳A-T︳大于等于1.6表的概率和，即P=p（1）+p（5）=0.1076+0.0166=0.1242,

按α=0.05水准不拒绝Ho，尚不能认为两组的发癌率有差别。

6.某医院收治了100例临床确诊的小儿佝偻病患者，入院时均分别作血生化检查与X

光片检查（表6-6）。欲了解此病法何者较敏感，试设计一整理表，并指出宜作何

统计处理？

应做配对设计表6-6佝偻病患儿入院检查登记表

编号生化检验X光片

100

每个患儿按检查顺序编号，生化指标及X光片阳性记为“+”，阴性记为“-”，根

据表6-6登记结果，整理归纳记入表6-9。

表6-9生化检查和X线检查结果

生化X线检查合计

检查+-

+αbα+b

-cdc+d

合计a+cb+dN

若在考虑了两法一致的a,d以后,仍拟比较两法何者较敏感,应做配对资料的X2检验.

)(

)(2





（b+c＞40）

)(

)1(2







（b+c＜40)v=1

8.某医生观察某新药对预防流行性感冒(流感)的效果,并作了统计处理(表3-18),你

对此有何意见

表6-7用药组和对照组流感患病率比较

发病数未发病数合计有效率%

服药组5013018072.2

未服药组4019023082.6

合计9032041078.05

X2=6.63,P＜0.05

（1）因旨在观察新药的效果，根据服药组有效率低于对照组（未服药）就不必进行

假设检验。

（2）应对本项实验观察的易感者暴露条件进行分析是否均衡可比。

第七章秩和检验

答案

填空题

1.非参数统计（秩和检验）

2.不受总体分布的限定，适应范围广，检验效率低于参数检验

3.P＜0.054.n＞25

是非题：

1.√2.√3.×4.√

单选题：

1.A2.D3.C4.D5.B6.B7.E8.E9.A10.D

11.C12.B

问答题：

1.参数检验与非参数检验的区别何在？各有何优缺点？

（1）参数检验与非参数检验的区别。

1）参数检验：以已知分布（如正态分布）为假定条件，对总体参数进行估计或检验。

2）非参数检验：不依赖总体分布的具体形式和检验分布（如位置）是否相同。

（2）参数检验与非参数检验的优缺点。

1）参数检验：优点是符合条件时，检验效率高；其缺点是对资料要求严格，如等

级数据、非确定数据（＞50mg）不能使用参数检验，而且要求资料的分布型已知

和总体方差相等。

2）非参数检验：优点是应用范围广、简便、易掌握；缺点是若对符合参数检验条

件的资料用非参数检验，则检验效率低于参数检验。如无效假设是正确的，非

参数法与参数法一样好，但如果无效假设是错误的，则非参数检验效果较差，

如需检验出同样大小的差异的差异往往需要较多的资料。另一点是非参数检验

统计量是近似服从某一部分，检验的界值表也是有近似的（如配对秩和检验）

因此其结果有一定近似性。

2．非参数检验适用那些情况？

（1）等级顺序资料。

（2）偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换，或虽经变量变

换但仍未达到正态或近似正态分布时，宜用非参数检验。

（3）未知分布型资料

（4）要比较的各组资料变异度相差较大，方差不齐，且不能变换达到齐性。

（5）初步分析。有些医学资料由于统计工作量过大，可采用非参数统计方法进行初步

分析，挑选其中有意义者再进一步分析（包括参数统计内容）

（6）对于一些特殊情况，如从几个总体所获得的数据，往往难以对其原有总体分布作

出估计，在这种情况下可用非参数统计方法。

3．为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”，而同一

组的相同数据不必计算“平均秩次？

因为在不同对比组，不取平均秩次会加大或减小某一组的秩和；而在同一组

内，出现相同数据不编平均秩次，该组秩和不受影响。

4．两样本比较的秩和检验当n

＞10，n

-n

＞10时采用u检验，这时检验是属于参数

检验还是非参数检验，为什么？

两组比较的秩和检验，当n大时，秩和分布近似正态分布，此时不必要再编制比n

更大的T检验界值表，而利用秩和分布随n增大渐近正态分布的性质，进行u检验，

故仍属于非参数检。

计算题：

1.试检验（表7-1）针刺不同穴位的镇痛效果有无差别？

（1）假设：Ho：三穴位镇痛效果的分布相同

：三穴位镇痛效果的不同或不全相同α=0.05

（2）计算检验统计量：

表7-1针刺不同穴位的镇痛效果

镇痛效果各穴位的观察频数秩次范围平均秩次

合谷足三里扶突合计

+3853471381～13869.5

++44292396139～234186.3

+++～293264.0

++++24163373294～366360.0

2462

185.89172.73192.31

H=12/[N（N+1）]×2

R/ni

-3（N+1）

=12/[366（366+1）×[219352/118+217642/126+234622/122]-3（366+1）

=2.212

C=1-Σ（3

t-ti

）/（N3-N）

=1-[（1383-138）+（963-96）+（953-95）+（733-73）]/（3663-366）

=1-0.0838=0.9162

=2.212/0.9162=2.414

（3）确定P值和作出推断结论：本题K=3，v=3-1=2，查附表9，X2界值表，得0.05

＞P＞0.25，按α=0.05水准，未拒绝Ho，尚不能认为三种穴位镇痛效果有差别。

2.某实验分别用两种方法对36件样品测定大肠菌指数，得表4-9资料，作t检验

（t=1.546，P>0.05），认为两法结果一致，你对此有何意见？

表7-2用两法测定36件水源水样品的结果

大肠菌指数DY-2法（样品数）发酵法（样品数）

95001

230063

940030

23000245

23800327

合计3636

均数18493.3321262.5

本实验数据应用t检验，存在下列问题：

（1）本实验属于配对设计，但整理成频数表已拆开原样本的对子，成为两组比较的

形式。

（2）频数分布呈极度偏态分布，不宜使用t检验

（3）应使用配对设计差值的符号秩和检验。

3.表7-3资料是12名宇航员航行前及返航后24小时的心率（次/分），问航行对心率

有无影响？

（1）假设：Ho：差值总体中位数Md=0

：差值总体中位数Md≠0α=0.05

（2）求检验统计量：

表7-3宇航前后24小时心率(次/分)

宇航员号航行前航行后差值秩次

(1)(2)(3)(4)(5)

17693-17-9

2716831

3706554

46165-4-3

58093-13-8

65978-19-11

77483-9-7

86279-17-10

97998-1912

107278-6-5

118490-6-6

12636032

=7T

=71

（3）确定P值和作出推断结论：任取T

＋

=7或T

－

=71，查附表10，T界值

表，得P＜0.01，在α=0.05水准上，拒绝Ho，接受H

，可以认为航行

对心率有影响。

4.配对比较两种方法治疗扁平足效果，记录如表7-4，问那种方法好？

（1）假设：Ho：两法疗效差值中位数Md=0

：Md≠0

α=0.05（2）求检验统计量：

表7-4甲乙两法治疗扁平足疗效比较

病例号甲法乙法差数秩次

（1）（2）（3）（4）=（2）-（3）（5）

1好1差3-2-9

2好1好10-

3好1差3-2-10

4好1中2-1-4.5

5差3中214.5

6中2差3-1-4.5

7好1中2-1-4

8好1差3-2-11

9中2中20-

10差3差30-

11好1中20-

12差3差30-

13好1中2-1-4.5

14中2差3-1-4.5

15好1中2-1-4.5

16中2差3-1-4.5

*1：好2：中3：差T

=4.5T

=761.5

（3）确定P值和作出推断结论：本题有5个差值d=0，故n=11，查附表10，

得P＜0.01，在α=0.05水准上，拒绝Ho，接受H

，可认为甲法疗效优

于乙法。

5.表7-5为测得铅作业与非铅作业工人的血铅值(μmol/L),问两组工人的血铅值有

无差别

（1）假设：Ho：两组工人血铅值总体分布相同

：两组工人血铅值分布不同

α=0.05

（2）求检验统计量：

表7-5铅作业工人和非铅作业工人血铅值(μmol/L)比较

铅作业组非铅作业组

血铅值秩次血铅值秩次

0.8290.241

0.8710.50.242

0.97120.293

1.21140.334

1.64150.445

2.08160.586

2.13170.637

0.728

0.8710.5

10.113

n1=7T1=93.5n2=10T2=59.5

（3）确定P值和作出推断结论，本题较小例数n

=7两组例数之差n

－n

=10-7=3，

查附表11，得P＜0.01，在α=0.05水准上拒绝Ho，接受H

，铅作业组平均

秩次为93.5/7=13.36，非铅作业平均秩次为59.5/10=5.95，可以认为铅作业

工人的血铅值高于非铅作业工人的血铅值。

6．比较表7-6两组肝炎婴儿的血清总胆红素有无差别？

（1）假设：Ho：两组肝炎婴儿的血清总胆红素总体分布相同

：两组肝炎婴儿的血清总胆红素总体分布不同

α=0.05

（2）求检验统计量：

表7-6两组肝炎婴儿的血清总胆红素

总胆红素人数秩次范围平均秩次秩和

μmol/L)一般组重症组合计一般组重症组

<17441～42.510

17～10105～149.595

80～1521715～312334546

160～191032～4136.536.5328.5

240～2242～4342.585

320～4444～4745.5182

400～2248～4948.597

合计301949T2=486.5T1=738.5

]12/)1([

]5.02/)1([





Nnn

NnT

=397.5

12/)149()30(19

5.02/)149(195.738[







计算u

：

C=1-Σ（)/()(33NNtt



=1-[（43-4）+（103-10）+（173-17）+（103+10）+（23-2）+（43-4）（23-2）]

/（493-49）

=1-5208/117600=0.9557

=5.379/9557.0=5.520

（3）确定P值和作出推断结论：查附表2，t界值表，v=∞，得P＜0.001，按α

=0.05水准，拒绝Ho，接受H

，可以认为重症组肝炎婴儿的血清总胆红素高

于一般组。

7.试检验表7-7三组人的血浆总皮质醇测定值有无差别？

（1）假设：Ho：三组人的血浆总皮质醇测定值总体分布相同

：三组人的血浆总皮质醇测定值总体分布不同或不全相同

α=0.05

（2）计算检验统计量如下表：

表7-7三组人的血浆总皮质醇测定值

正常人单纯性肥胖皮质醇增多症

测定值秩次测定值秩次测定值秩次

0.1110.1722.7020

0.5240.3332.8121

0.6160.5552.9222

0.6980.6673.5923

0.7790.8610.53.8625

0.8610.51.13144.0826

1.02121.38164.3027

1.08131.63174.3028

1.27152.04195.9629

1.92183.75246.6230

Ri96.5117.5251

Ni101010

H=12/[N（N+1）]×ΣR

2/n-3（N+1）

=12/[30（30+1）]×（96.52+117.52+2512）/10-3（30+1）=18.122

v=k-1=3-1=2，查附表9，X2界值表，得P＜0.005，在α=0.05水准上拒绝

Ho，接受H

，可以认为三组人的血浆总皮质醇测定值分布不同。

（3）多样本两两比较如表4-7

Ho：任两组人的血浆总皮质醇测定值总体分布相同

：任两组人的血浆总皮质醇测定值总体分布不同

α=0.05

两两比较秩和差数的绝对值

各组秩和D=｜RA-RB｜

单纯性肥胖117.5皮质醇增多症251

正常人96.521154.5

单纯性肥胖117.5133.5

本题n=10，k=3，查附表13，D界值表，D

0.05（10，3）

=92.3，D

0.01（10，3）

=114.7，在

α=0.05水准上，皮质醇增多症与正常人、单纯性肥胖组比较，均拒绝Ho，接受H

，

可认为对比组间有差别（P＜0.01），而单纯性肥胖与正常人相比，P＞0.05，未拒

绝Ho，尚不能认为两组间的血浆总皮质醇测定值有差别。

8．在研究某地方病的病因工作中，用病区的粮食做动物实验，今有两组大白鼠，分别

用甲，乙两种饲料配方饲养，观察鼠的心肌坏死面积（小格数）如表7-8，问两组

间的坏死面积有无差别？本资料用t检验和秩和检验何者为好？为什么？

表7-8甲，乙两组心肌坏死面积（小格数）比较

甲组乙组

面积×频数秩和面积×频数秩和

0.0×1013×100.0×1513×15

0.2×12.750.2×32.75×3

0.3×130.50.3×130.5

0.4×233.5×20.4×233.5×2

0.6×1360.9×237.5×2

1.0×1391.3×140

1.6×1411.7×142

2.2×1432.8×145

2.6×1447.4×153

3.3×14613.0×155

4.3×1

5.1×1

5.4×1

5.5×1

6.1×1

6.2×1

9.7×1

13.8×1

36.0×1

合计n2=29T2=968n1=28T1=685

应用t检验的条件是所分析的数据来自正态分布总体，而且要求相应的两总

体方差相等，故首先列出两组数据的频数分布表。由频数表可见两组数据呈极

度偏态，且总体方差不齐（S甲2=50.32，S乙2=7.66，F6.569，P＜0.05），故

应使用秩和检验。

（1）假设：Ho：两组坏死面积的分布相同

：两组坏死面积的分布不同

α=0.05

（2）计算检验统计量：

12/)1(

5.02/)1([





Nnn

NnT

019.2

12/)157(2928

]5.02/)157(28685[







计算较正u

：

C=1-Σ（t3-t

）/（N3-N）

=1-[（253-25）+（43-4）+（23-2）+（43-4）]/（573-57）=0.9151

=111.29151.0/019.2/cu

（3）确定P值和作出推断结论：查附表2，t界值表，v=∞，得0.05＞P＞0.01，

在α=0.05水准上拒绝Ho，接受H

，故可以认为甲乙两组饲料配方饲养大鼠，

心肌坏死面积不同，甲组坏死面积较大。

第八章直线相关与回归

答案

填空题

1、Y

=α+bx

2、依存关系，相互关系与密切程度

3、直线回归、截距、回归系数

4、-1——1

5、r与b假设检验是等价的

6、相关关系的密切程度和相关方向指标。

7、回归平方和（

-Y）2、剩余平方和Σ（Y-

）2

8、截距，回归系数，斜率

9、相互关系的密切程度，相关方向

是非题：

1.√2.×3.√4.√5.×6.×7.×8.√9.×10.√

单选题：

1.D2.C3.D4.D5.C6.D7.B8.D9.E10.B

11.E12.D13.E14.A15.B16.A17.B18.C19.C20.E

问答题：

1.应用直线回归和相关分析时应注意那些问题？

（1）作回归分析和相关分析时要有实际意义，不能把毫无关联的两种现象作回归、相

关分析，必须对两种现象间的内在联系有所认识。

（2）在进行回归和相关分析之前，应绘制散点图。当观察点的分布有直线趋势时，才

适宜作回归、相关分析。如散点图呈明显曲线趋势，应使之直线化再行分析。散点图

还能提示资料有无可疑异常点。

（3）直线回归方程的实用范围一般以自变量的取值范围为限。若无充分理由证明超过

自变量取值范围外还是直线，应避免外延。

（4）双变量的小样本经t检验只能推断总体两变量间有无直线关系，而不能推断相关

的紧密程度，样本含量必须很大。

（5）相关关系不一定是因果关系，也可能是伴随关系，有相关关系不能证明事物间确

有内在联系。

2.用什么方法考察回归直线图示是否正确？

（1）直线必须通过点（YX,）。

（2）若纵横坐标无折断号时，将直线左端延长与纵轴相交，交点的纵坐标必等于截距

α。

(3)直线是否在自变量Ｘ的实测范围内。

3.r与r

的应用条件有何不同？

积差相关系数r用于描述双变量正态分布资料的相关关系。

等级相关系数r

适用于下列资料：

（1）不服从双变量正态分布而不宜作积差相关分析的资料。

（2）总体分布型未知的资料：

（3）原始数据是用等级表示的资料。

4.某资料n=100,X与Y的相关系数为r=0.2,可否认为X与Y有较密切的相关关系？

N=100，r=0.2时，对相关系数进行t检验，按检验水准α=0.05，拒绝Ho（ρ=0）,

接受H

（ρ≠0），认为两变量有相关关系，但决定系数r2=0.22=0.04，表示回归

平方和在总平方和中仅占4%，说明两变量间的相关关系实际意义不大。

5.相关系数与回归系数的区别与联系

（1）区别：

①资料要求上：回归要求因变量Ｙ服从正态分布，Ｘ是可以精确测量和严

密控制的变量，称Ⅰ型回归；相关要求两个变量Ｘ、Ｙ服从双变量正态

分布，这种资料若进行回归分析称为Ⅱ型回归

②应用上：说明两变量间依存变化数量关系用回归，说明变量间的相关关

系用相关。

③意义上：b表示Ｘ每增（减）一个单位，Ｙ平均改变b个单位，r说明具

有直线关系的两个变量间相关关系的密切程度与相关方向。

④计算上：b=

XXXY

ll/，r=

YYXYXY

lll/

⑤取值范围：-∞＜b＜+∞；-1≤r≤1。

⑥单位：b有单位，r没单位。

（2）联系：

①对一组数据若同时计算b和r，它们的正负号一致

②b和r的假设检验是等价的，即对同一样本，t

。

③用回归解释相关，决定系数r2=l

2/l

=SS回/SS总，回归平方和越

接近总平方和，则r2越接近1，说明引入相关的效果越好。

计算题

1.10名20岁男青年身高（cm）与前臂长（cm）如下，问两者有无相关关系？

身高3180165

前臂长454244443

（1）计算相关系数：由原始数据及散点图的初步分析，估计本资料有直线趋势。

ΣΧ=1725，ΣΧ2=298525，

=172.5

ΣУ=454ΣУ2=20690，

=45.4ΣΧУ=78541

=ΣΧ2-（ΣΧ）2/n=298525-17252/10=962.5

=ΣΧ2-（ΣΧ）2/n=20690-4542/10=78.4

=ΣΧУ-（ΣΧ）（ΣУ）/n=78541-1725×454/10=226

（2）与ρ=0进行假设检验。

Ho：ρ=0，即身高与前臂长间无直线相关关系

：ρ=0，即身高与前臂长间有直线相关关系

α=0.05

υ=n-2=10-2=8

查t界值表，得0.002＜P＜0.005，按α=0.05水准拒绝Ho，

2.某省卫生防疫站对8个城市进行肺癌死亡回顾调查，并对大气中苯并（a）芘行检

测，结果见表，试检验两者有无相关？

表8-18个城市肺癌标化死亡率与大气中苯并（a）芘的相关分析

肺癌标化死亡率(1/10万)

__________________________________________________________________________

城市编号X等级Y等级dd2

(1)(2)(3)(4)(5)(6)=(3)-(5)(7)

15.6010.05100

218.5081.17711

316.2361.05600

411.4030.10211

513.8050.75500

68.1320.503-11

718.0070.65439

812.1041.208416

∑d2=28

本题资料不服从双变量正态分布，宜计算等级相关系数。

Ho：ρ

=0，即肺癌标化死亡率与大气中苯并（α）芘无相关关系

：ρ

≠0，即肺癌标化死亡率与大气中苯并（α）芘有相关关系

α=0.05

由上计算表，r

=1-6Σd2/[n（n2-1）]=1-6×28/[8×（82-1）]=0.6667查附表15，

界值表，得0.10＞P＞0.05，按α=0.05水准不拒绝Ho，尚不能认为肺癌标化死

亡率与大气中苯并（α）芘间有相关关系。

3.就表8-2（1）（2）（4）栏资料分析血小板和出血症的关系。

表8-2血小板数与出血症状的等级相关分析

血小板数(×109/L)出血症状

病例号X等级Y等级dd2

(1)(2)(3)(4)(5)(6)=(3)-(5)(7)

11201++10.5-9.590.25

21302+++12.0-10.0100.00

31603±7.0-4.016.00

43104-3.50.50.25

54205+8.5-3.512.25

65406+8.5-2.56.25

77407-3.53.512.25

810608-3.54.520.25

9126010-3.56.542.25

1012309-3.55.530.25

11144011++10.50.50.25

12200012-3.58.572.25

∑d2=402.5

本例“出血症状”为等级数据，宜计算等级相关系数。

Ho：ρ=0，即血小板数与出血症无相关关系

：ρ≠0，即血小板数与出血症有相关关系

α=0.05因出血症状Ｙ中相同秩次较多，需计算校正r

值r,

。

T=0

T=Σ（t3-t）/12=[（63-6）+（23-2）+（23-2）]/12=18.5

5.182]6/)1212[(0]6/)1212[(

5.402)5.180(]6/)1212[(





=-0.5059

查附表15，r

界值表，得0.10＞P＞0.05，按α=0.05水准，不拒绝Ho，尚

不能认为血小板数与出血症状间有相关关系

4.某单位研究代乳粉营养价值时，用大白鼠作实验，得到大白鼠进食量（g）

和体重增加量（g）的数据如下：

表8-3八只大白鼠进食量（g）和体重增加量（g）

鼠号12345678

进食量（g）89

体重增加（g）3

(1)此资料有无可疑的异常点

(2)求直线回归方程并对回归系数作假设检验.

(3)试估计进食量为900g时,大白鼠的体重平均增加多少,计算其95%的可信区

间,并说明其含义.

(4)求进食量为900g时,个体Y值的95%容许区间,并解释其意义.

解：(1)由散点图及回归直线综合分析,点(800,185)可视为异常点.

(2)有原始数据求得直线方程

对回归系数作检验

Ho:=0,即进食量与增重无直线关系

H1:0,即进食量与增重有直线关系



=0.05

方差分析法

总

7v,875.4052lyy

查F界值表,得P<0.05,按



=0.05的水准,拒绝Ho,接受H

可认为进食量与增重间

有直线关系.

t检验法

查t界值表,得P<0.01结论同上.

第九章统计图表

答案

填空题

1.突出重点，简单扼要，主谓分明，层次清楚。

2.标题，标目，线条，数字，备注。

3.频数分布图（直方图）。

是非题

1.√2.√3.×4.√5.×6.×7.×

单选题：

1.A2.B3.D4.E5.D6.D7.D8.B9.D10.C

11.E12.D13.E14.E15.C16.E17.A18.C19.B20.E

21.C

问答题：

1.列表的原则和基本要求是什么？

（1）列表的原则：重点突出，简单明了；主谓分明，层次清楚。

（2）列表的基本要求：

①应有简明扼要说明统计表内容的标题。既不能过与简略，也不呢能过于繁琐

或不确切。

②标目文字要简明，有单位的标目要注明，标目不宜过多，层次应清楚。

③线条不宜过多。除顶线、底线、纵标目下与合计行上面的线条外，其他线条

一般均应省去。表的左上角不宜有斜线。

④表内数字小数位数保留应一致，位次应对齐，不宜留空格。暂缺或未记录用

“…”表示，无数字用“—”表示，数字是“0”则应填写“0”。

⑤备注一般不列入表内，应用“＊”号引出，写在表的下面。

2.常用的统计图有哪几种？他们的适用条件是什么？

常用的统计图有条图、百分条图、圆图、线图、半对数线图、直方图、散点图

和统计地图等。

（1）直条图：用等宽直条的长短来表示相互独立的各项指标的数值大小，如发病率等。

（2）百分条图、圆图：用长条各段的面积、圆的扇形面积来表示事物内部各构成部分

的分布情况，即各构成比重的大小，如构成比。

（3）普通线图：用线段的升降来表示连续性资料随时间的变迁、某事物现象的动态及

变化趋势。

（4）半对数线图：用线段的升降来表示连续性资料随时间的变迁和某事物现象发展变

化的速度。

（5）直方图：用直方面积的大小表示数值变量资料频数分布的情况。

（6）散点图：用点的密集程度和趋势表示两变量间的相关关系。

（7）统计地图：用不同的纹线或颜色说明指标高低，描述某事物现象在行政区域上的

分布情况。

3.某医院对麦芽根糖浆治疗急慢性肝炎161例的疗效列表9-1，试作改进。

表9-1麦芽根糖浆治疗急慢性肝炎疗效观察

效果

总

例数

有效

无效

小计近期痊愈好转

例%例%例%例%

16110867.17043.53823.65332.9

改后如下表：

表9-2麦芽根糖浆治疗急慢性肝炎疗效观察

疗效例数疗效构成比（%）

无效5332．92

好转3823．60

近期痊愈7043．48

合计161100．00

计算题

1．某防疫站1972年开始在城关建立“预防接种卡”使计划免疫得到加强。为说明

效

果,1975年的5月观察了482人的锡克试验反应，其中:幼儿园儿童101人，阳性

21人，小学生145人，阳性22人；中学生236人，阳性15人。相比起来，1974

年为：幼儿园儿童144人，阳性37人，小学生1417人，阳性323人；中学生259

人，阳性41人。试用适当的统计表和统计图描述上述结果，并作简要分析（表9-3）

表9-3某县两年不同人群锡克试验反应结果分析

19741975

调查人数阳性人数阳性率（%）调查人数阳性人数阳性率（%）

幼儿园1443725.691012120.79

小学生141732322.791452215.17

中学生3594111.42236156.36

第十章实验与调查设计

答案

填空题

1、处理因素，受式对象，实验效应

2、对照原则，均衡原则，随机化原则，重复原则

3、第一类错误概率α即检验水准，检验效能1-β，容许误差，总体标准差或用“S”

来代替

4、空白对照，实验对照，标准对照，历史对照，自身对照，相互对照，

5、普查，非全面（抽样调查）典型调查

6、单纯随机抽样，系统抽样，整群抽样，分层抽样

7、标准对照

是非题：

1.√2.√3.√4.×5.√6.√7.×8.×9.×

单选题：

1.E2.C3.E4.D5.D6.C7.A8.D9.B10.D

11.A12.A13.E14.C15.D16.C

问答题：

1.1976年某单位报告了果胶驱铅的疗效观察。30名铅中毒工人脱离现场后住院治疗，

治疗前测得尿铅的均数为0.116mg/L，血铅均数为1.81mg/L。服用20天后再测，尿

铅均数降为0.087mg/L，血铅均数降为0.73mg/L。说明果胶驱铅有较好的驱铅作用。

此实验目的是要观察果胶的驱铅作用。人体对外来有害物质有解毒功能，因而铅

中毒者在脱离现场后经一段时间，血、尿中铅含量会下降（自然排铅）。该设计最

大缺点就在于无对照，其结果不知血铅和尿铅的下降是果胶的作用，还是人体自然

排铅的结果。另外，只凭上述血铅和尿铅在治疗前后的均数，不作假设检验就下“果

胶有较好的驱铅作用”的结论自然不妥，较好的设计应将30名患者随机分为两组，

一组给予果胶，另一组给予具有肯定作用的驱铅药物如EDTA（即标准对照）等，经

治疗一定时间后，以两组血铅及尿铅的变化值作假设检验，再下结论。

2.某单位研究菊花艾叶香预防感冒及空气消毒效果，对象为某幼儿园分住三个楼的儿

童。中楼是中班的儿童（160人），东楼是小班（80人）的儿童，此两楼燃香；西楼

是大班（160人）的儿童，不燃香为对照组，结论为该艾叶香无预防感冒效果，但有

空气消毒作用（肉汤平板上菌落数较少）。

该试验目的是观察野菊花艾叶香预防感冒和空气消毒的作用，但三组之间缺乏

均衡性：

（1）三栋楼房条件不同。

（2）三组儿童年龄不同：不同年龄儿童对感冒抵抗力不同，大班儿童自然会比中班、

小班儿童对感冒抵抗力强，故无法观察预防感冒的作用。

（3）设立对照也有问题，空气消毒是野菊花艾叶香的燃香作用，还是烟作用无法区

别，故达不到试验目的。应设立实验对照。

3.为寻找营养丰富而有经济实惠的婴幼儿食品，以搞好儿童保健，某研究所利用甘蔗

废糖蜜试制了L-赖氨酸（简称赖氨酸盐）。通过实验研究了解膳食中添加赖氨酸盐

后对正常儿童生长发育有无影响，如何考虑：

（1）实验组与对照组的设置均衡性：

实验组与对照组条件要均衡，除处理因素外，其它条件应尽量相同，因此应

选全托儿所的同龄、身体发育正常、健康的儿童作为观察对象，使实验组与对照

组应在性别、年龄、生活条件、健康知识等有关因素尽量做到相近。

（2）实验对象的随机化分配方法：

将符合条件的实验对象依花名册顺序号，使用随机数字表，按随机原则进行分组。

样本含量借助参考文献各项指标的数据，设定α，1-β进行样本例数估计。

（3）实验持续时间及观察指标、项目：

实验持续时间的确定以能看出显着变化为原则，如持续时间短，区别不出效

应指标的变化；而持续时间过长，则给试验带来较多的困难与人力、物质的浪费。

观察指标：①形态指标：身高、体重、胸围、坐高、皮下脂肪厚度等；②功能指

标：脉搏、血压、肺活量、呼吸次数等；③生化指标：Hb（g/L）、WBC（×

109/L）等。

（4）统计分析表及统计分析方法：

1）计算各项指标实验前、后均值、标准差（见表）。

2）作统计分析以了解每组实验前后标化是否有统计意义，可按组别对各项指标受

试前后进行配对t检验，再对两组实验前后的差数用成组设计两均数比较的t

检验，检验实验组与对照组各项指标差别有无统计意义。

表不同食物组实验前后儿童生长发育指标比较（

±S）

指标普通食物组加赖氨酸盐组

实验前实验后实验前实验后

身高（cm）

体重（kg）

：

脉搏（次/分）

血压（kPa）

：

Hb（g/L）

WBC（×109/L）

4.调查研究和实验研究的主要区别何在？

按研究是否对观察对象施加干预（即处理因素）可分为调查与实验。调查即研究

者只是被动的调查客观实际情况，而未加任何干预。实验比调查能更好地控制误差。

基于上述差别，调查与实验研究在统计分析上也不尽相同。

（1）调查研究：①研究因素（处理因素）是客观存在的；②不能通过随机化分组的方

法来平衡混杂因素。

（2）实验研究：①研究者能人为设置处理因素；②受试对象接受何种处理因素或水平

是由随机分配而定。

5.估计样本例数的意义何在？需要确定那些前提条件？

（1）估计样本例数的意义：在调查或实验研究中都要对样本例数进行估计，如果例数

太少，有可能把个别情况误认为普遍情况，把偶然性或巧合的现象当做必然规律

现象，以至错误地推论到总体，例数太多，势必造成人力、物力的浪费。在保证

实验结果有一定可靠性的条件下，确定最少的样本例数，以节约人力和经费。

（2）样本含量的估计可分为两类，一类是作参数估计时的样本含量估计；另一类是作

指标比较时的假设检验中样本含量的估计。两种方法不同，决定样本含量的因素

亦有所不同。现分述如下。

1）参数估计时，影响样本含量的因素有：①容许误差δ。容许误差越小，所需

样本含量越多；②Ⅰ型错误的概率α。α越小，则所需样本含量越多；③总体

标准差σ。σ越大，所需样本含量越大；④总体是无限总体，所需样本含量

较多；如系有限总体则总体单位数越小，所需样本含量也越少。

2）指标比较时，决定样本含量的因素是：①Ⅰ型误差的概率α。α越小，样本含

量越大；②检验效能1-β。β为Ⅱ型误差的概率，1-β越大，所需样本含量

越大；③容许误差δ。δ越小则样本含量越大；④总体标准差σ或总体率

π。σ越小，n越小，π越接近0.5样本含量越大；⑤单侧检验所需样本含

量较少，双侧检验所需样本含量较多。

6.调查研究和实验研究的只要区别何在？

按研究是否对观察对象施加干预（即处理因素）可分为调查与实验。调查即研

究者只是被动的调查客观实际情况，而未加任何干预。实验比调查能更好地控制误

差。基于上述差别，调查与实验研究在统计分析上也不尽相同。

（1）调查研究：①研究因素（处理因素）是客观存在的；②不能通过随机化分组

的方法来平衡混杂因素。

（3）实验研究：①研究者能人为设置处理因素；②受试对象接受何种处理因素

或水平是由随机分配而定。

7.估计样本例数的意义何在？需要确定那些前提条件？如何进行估算？

（1）估计样本例数的意义：在调查或实验研究中都要对样本例数进行估计，如

果例数太少，有可能把个别情况误认为普遍情况，把偶然性或巧合的现象当

做必然规律现象，以至错误地推论到总体，例数太多，势必造成人力、物力

的浪费。在保证实验结果有一定可靠性的条件下，确定最少的样本例数，以

节约人力和经费。

（2）样本含量的估计可分为两类，一类是作参数估计时的样本含量估计；另一

类是作指标比较时的假设检验中样本含量的估计。两种方法不同，决定样本

含量的因素亦有所不同。现分述如下。

1）参数估计时，影响样本含量的因素有：①容许误差δ。容许误差越小，所

需样本含量越多；②Ⅰ型错误的概率α。α越小，则所需样本含量越多；③

总体标准差σ。σ越大，所需样本含量越大；④总体是无限总体，所需样本

含量较多；如系有限总体则总体单位数越小，所需样本含量也越少。

2）指标比较时，决定样本含量的因素是：①Ⅰ型误差的概率α。α越小，样本

含量越大；②检验效能1-β。β为Ⅱ型误差的概率，1-β越大，所需样本含

量越大；③容许误差δ。δ越小则样本含量越大；④总体标准差σ或总体

率π。σ越小，n越小，π越接近0.5样本含量越大；⑤单侧检验所需样本

含量较少，双侧检验所需样本含量较多。

如何进行样本含量估算，根据已知条件，区别调查研究还是实验中统计量的

比较，以及数值变量还是分类变量，可按样本估计的专用公式计算，或查样

本例数估计专用表。

8.实验为什么要设对照组？如何设对照组？

设对照可以使处理因素和非处理因素的差异有一个科学的对比。

设立对照的目的是抵消对照组与处理组非处理因素的影响，处理因素效应得以充

分显示出来。主要有空白对照、安慰剂对照、实验对照、标准对照、历史对照、

自身对照和相互对照等六种形式，可以根据研究目的和内容加以选择。

9.常用的实验设计有那些？

（1）完全随机设计。亦称单因素设计

（2）配对设计

（3）配伍组设计，亦称随机区组设计，是配对设计的扩大。

（4）析因试验设计、拉丁方设计、正交设计，这些都是多因素，高效率的实验设计。

计算题

1．根据既往观察，人群接种某预防制剂后，体温高于37.5℃的反应率为10%，今欲推

广使用，拟再次证实，要求容许误差在真实反应率的20%以内，α=0.05，问按单

纯随机抽样需观察多少人？

本题为调查总体率的样本含量估计。已知：

π=0.1，δ=0.2×π=0.2×0.1=0.02，双侧u

0.05

=1.96

2

u（1-π）/δ2

=1.962×0.1×0.9/（0.2×0.1）2≈865（人）

2．拟用放射免疫法检测某人群（5000人）血液中流行性脑脊髓膜炎（流脑）特异免

疫球蛋白含量，根据文献报告，本例为计量资料有限总体抽样的样本含量估计，其

标准差为0.5mg/L，容许误差为0.1ml/L，试按单纯随机抽样估计样本例数。

已知：N=5000，σ=0.5μg/ml，δ=0.1μg/ml。

若规定：双侧α=0.05，u

0.05

=1.96

则：n=（U

σ/δ）2=（1.96×0.5/0.1）2=96.04≈97（人）

=n/（1+n/N）=97/（1+97/5000）

=95.15≈96（人）

3．某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查，据已掌握的情况，将

全县各乡分为好、较好、差三类，各随机抽取1/10的学龄前儿童作调查，结果如表

10-1，试估计该县百白破疫苗接种率的95%可信区间。

表10-1某县三类乡百白破疫苗接种率调查结果

类别人数抽样人数接种率

好73717230.8174

较好1489914780.6969

差93089300.3022

合计315783131

本题为求按比例分配的分层抽样中总体率的可信区间，首先计算接种率及其标准

误。

（1）p=[ΣΝ

]/Ν=[7371×0.8174+14899×0.6969+9308×0.3022]/31578

=19221.0461/31578=0.608685

（2）NnppNnNs

iiiiip

/)1/()1()[(/1(2

=31578/)}1930/(6978.03022.0)[9308/9301(

9308)]1723/(1826.08174.0)[7371/7231(

7371

=0.007520

该率不接近于0或1，一般认为服从二项分布。因n=3131，较大，可用正态近似法

计算其可信区间。

95%CI：P±1.96Sp=0.608635±1.96×0.007520=（0.5939，0.6234）

👁️ 阅读量：0

🔖 本文标签：

🔥 最新发布文章