📜  Python|肯德尔等级相关系数(1)

📅  最后修改于: 2023-12-03 15:19:22.248000             🧑  作者: Mango

Python|肯德尔等级相关系数

简介

肯德尔等级相关系数(Kendall's rank correlation coefficient),用于衡量两个随机变量之间顺序相关性的指标。它的取值范围在-1到1之间,其中值为1表示完全正向相关,0表示无关,-1表示完全负向相关。

公式

Kendall's rank correlation coefficient 的计算公式为:

其中:

  • n表示样本数
  • $P$表示对于第一个变量的任意两个样本值进行比较而言同时有两个变量的值的强度一致的比较对数,相当于"等于"比较,即两个变量的值相同的样本对的个数;
  • $Q$表示对于第一个变量的任意两个样本值进行比较而言同时有两个变量的值的强度不一致的比较对数,相当于"不等于"比较,即第一个变量中值大于另一个变量中值的样本对个数的个数。
使用方法

Python中,可以使用scipy库来计算Kendall's rank correlation coefficient。以下是一个简单的例子:

import scipy.stats as stats

x = [2, 4, 1, 3, 5]
y = [9, 1, 8, 2, 7]

kendall_coeff = stats.kendalltau(x, y).correlation
print(kendall_coeff)

输出结果为:-0.2,表示两个变量的排名之间存在负相关。

总结

Kendall's rank correlation coefficient是一种衡量两个随机变量之间顺序相关性的指标。在Python中,可以使用scipy库来计算它的值。