📜  统计-科恩的kappa系数

📅  最后修改于: 2021-01-23 06:29:06             🧑  作者: Mango


科恩的kappa系数是一种统计数据,用于衡量定性(分类)项目的评估者之间的一致性。通常认为它比简单的百分比协议计算更为可靠,因为k考虑了偶然发生的协议。科恩的kappa度量两个评估者之间的协议,每个评估者将N个项目分为C个互斥类别。

科恩的卡伯系数由以下函数定义和给出:

$ {k = \ frac {p_0-p_e} {1-p_e} = 1-\ frac {1-p_o} {1-p_e}} $

哪里-

  • $ {p_0} $ =评估者之间的相对观察一致。

  • $ {p_e} $ =机会一致的假设概率。

使用观察到的数据计算$ {p_0} $和$ {p_e} $,以计算每个观察者随机说出每个类别的概率。如果评估者完全同意,则$ {k} $ =1。如果评估者之间没有达成协议,只是偶然的期望(由$ {p_e} $给出),则$ {k} $≤0 。

问题陈述:

假设您正在分析与一组50个人申请资助有关的数据。每个赠款提案均由两名读者阅读,并且每个读者对提案都说“是”或“否”。假设不同意计数数据如下,其中A和B是读者,左斜斜角的数据显示的是协议的计数,而右斜斜角的数据则显示的是:

  B
Yes No
A Yes 20 5
No 10 15

计算科恩的卡伯系数。

解:

请注意,读者A和读者B都批准了20个提议,而两个读者都拒绝了15个提议。因此,观察到的比例一致是

$ {p_0 = \ frac {20 + 15} {50} = 0.70} $

为了计算$ {p_e} $(随机同意的概率),我们注意到:

  • 读者A对25个申请人说“是”,对25个申请人说“否”。因此,读者A在50%的时间内说“是”。

  • 读者B对30位申请者说“是”,对20位申请者说“否”。因此,读者B有60%的时间说“是”。

使用公式P(A和B)= P(A)x P(B),其中P是事件发生的概率。

他们两个人随机说“是”的概率是0.50 x 0.60 = 0.30,而他们两个人都说“否”的概率是0.50 x 0.40 = 0.20。因此,随机同意的总概率为$ {p_e} $ = 0.3 + 0.2 = 0.5。

因此,现在将我们的公式应用于科恩的Kappa中,我们得到:

$ {k = \ frac {p_0-p_e} {1-p_e} = \ frac {0.70-0.50} {1-0.50} = 0.40} $