
标准误的计算公式
-
2023年2月27日发(作者:珠算加减法口诀表)matlab算kappa系数,[转载]Kappa系数的计算及应⽤
Kappa⼀致性相关分析中经常应⽤的Kappa系数有三种,即简单Kappa系数,加权Kappa系数和总Kappa系数及标准误和检验统计量的计
算公式,并针对Kappa系数仅适⽤于⾏数和列数相等的⽅表的问题,给出了⽤SPSS软件实现对⾏列数不等资料的Kappa检验⽅法。
1简单Kappa系数的计算公式[1]
K=P0-Pe1-Pe
其中P0=∑ipii,称为观测⼀致率,Pe=∑,称为期望⼀致率,即两次检验结果由于偶然机会所造成的⼀致率,其中
pi.=RiN,pi=CiN,Ri,Ci分别为第i个格点所对的⾏合计和列合计,N为总例数。当两个诊断完全⼀致时,P0=1,此时Kappa值为1。当
观测⼀致率⼤于期望⼀致率时,Kappa值为正数,且Kappa值越⼤,说明⼀致性越好。当观察⼀致率⼩于期望⼀致率时,Kappa值为负数,
这种情况⼀般来说⽐较少见。根据边缘概率的计算,Kappa值的范围值应在-1~1之间。Kappa≥075两者⼀致性较好;0.75Kappa≥0.4
两者⼀致性⼀般;Kapp.4两者⼀致性较差。
Kappa系数标准误的计算公式为:
S=Pe+P2e-∑
其95%的置信区间为:
由于Kappa值是⼀个样本统计量,作是否有统计学意义的假设检验时,应选⽤统计量:
U=KappaS
2加权的Kappa系数[2]
加权的Kappa系数是简单Kappa系数的推⼴,是⽤加权的⽅法对两个评价结果进⾏量化。对于四格表来说,简单Kappa系数与加权的Kappa
系数是相等的,对于⼀般的⾏列表,加权的Kappa系数的计算公式为:
Kw=P0-Pe1-Pe
P0=∑i∑jwijpij
Pe=∑i∑
其中0≤wij=wji1,i≠j,wij=1。
加权Kappa系数的标准误计算公式为:
Skw=∑i∑[wij-]2-P2e)2N
95%的置信区间为:
假设检验的统计量为U=kWSkw
Kappa的权系数⼀般使⽤CicchettiAllison和FleissCohen两种权值类型[2],CicchettiAllison的计算公式为:
wij=1-Ci-CjCk-Ci
FleissCohen的计算公式为:
wij=1-22
其中,Ci表⽰第i列的评价分值,k表⽰列数。假如是数值型变量,评价分值Cij就是第i⾏第j列对应的具体数值;假如是分类变量,可按照相
应级别进⾏赋值。由于wij=1,⽽当i≠j时,0≤wij1,所以由Kappa系数的计算公式可知加权的Kappa系数⼤于简单Kappa系数。
3总Kappa系数
假设列联表为多向列联表,且每个变量有两个⽔平,即为2×2×…×2列联表,令ki表⽰第i个变量的Kappa系数,Ski表⽰第i个Kappa系数
的标准误,则总Kappa系数的计算公式为:
K总=∑qi=1kiSki/∑qi=11Ski
若要检验各变量Kappa系数是否都相等,可采⽤⾃由度为q-1的χ2检验,计算公式为:
χ2=∑qi=12Ski
、两个公式均适⽤于加权的Kappa系数。
4⾏列数不等时Kappa系数的计算
Kappa系数的计算适⽤于两个评价⼈分级⽔平数相同的情况,即数据格式为⾏数和列数相等的⽅表。⽽在实际操作中,经常会出现分级⽔平
数不⼀致,即⾏列数不等的情况。我们来看⼀个实例:两名医⽣按照某项指标的1~4个等级来评价8个病⼈。⼀个医⽣⽤全部4个等级进⾏
评价,⽽另⼀医⽣只有3个等级进⾏评价。此时,对于两个医⽣来说,他们评价的级别范围不同。数据见表1。
表1甲⼄两医⽣对病⼈的评价
下⾯我们使⽤SPPS软件获得Kappa值及检验结果。SPSS110或更低的版本在这种情况下均⽆获得Kappa统计量。SPSS115以上的版本
可以计算出Kappa值。⾸先进⼊数据编辑器并给甲医⽣添加额外的观测值0001。数据录⼊见图1。选择
Analyze→DescriptiveStatistics→Crosstabs,将变量甲,⼄分别放⼊对应的⾏列框内,选择Statistics按钮,得到如下对话框,选择
Kappa复选框,按continue即可输出Kappa值、标准误和P值。
相应的结果为:
Kappa=0.810,P=0.001,S=0.176。
5讨论
在诊断试验的研究中,数据资料多为双向有序的列联表资料,即两个变量都是有序变量,⽽且属性相同。属性相同分为三种情况,⼀种情况
是属性、分级⽔平数和分级⽔平都完全相同。如甲医⽣和⼄医⽣都把病⼈的检查结果分为1、2、3、4四个等级。此时可直接作Kappa检
验。当这两个变量都只有2个⽔平时,就成为配对设计的四格表资料,可使⽤配对χ2检验,即McNemar检验。第⼆种是属性相同的分级⽔
平数相同,但分级⽔平不全相同。如甲医⽣和⼄医⽣都把病⼈的检查结果分为四个等级,但甲医⽣的分级为1、2、3、4,⽽⼄医⽣的分级
为2、3、4、5。在这种情况下,由于列联表的⾏数和列数仍然是⼀致的,即列联表仍为⽅表,所以也可计算出相应的Kappa统计量。第三
种是属性相同,但分级⽔平数和分级⽔平不全相同。这种情况就是我们所说的列联表的⾏列数不⼀致。由于收集上来的数据不能轻易删除
掉,所以我们考虑添加⾏或列使联表成为⽅表。如⾏数为n,例数为n-1,则我们只需要添加第n列,在第n⾏第n列的格点中添加权值
0001,⽽第n⾏的其它格点均设为0,就可以命名其成为⽅表,并计算Kappa统计量了。由于权值系数很⼩,所以不会影响Kappa值的计算
结果。
另⼀⽅⾯,假如两个变量中有⼀个变量是⾦标准,那么我们不但能分析出检验结果的⼀致性,还可以计算出敏感度、特异度、误诊率和漏诊
率等指标。假如有不同的诊断分界点,还可以绘制出ROC曲线。
诊断试验的评价[3]在医学研究中具有⼗分重要的意义,⽬前⼤多数⽂献都使⽤Kappa统计量来检验结果的⼀致性。所以本研究主要是对
Kappa系数作⼀个探讨和分析。诊断试验评价的统计学⽅法还会随着更多问题的提出和解决⽽不断得到发展、修正和扩展。