📜  统计-偏度(1)

📅  最后修改于: 2023-12-03 15:27:36.881000             🧑  作者: Mango

统计-偏度

统计学中的偏度是指一组数据分布的不对称性度量。通俗点说,就是数据在均值附近分布的程度。如果均值附近的分布是对称的,则偏度为0;如果分布尾巴向左,偏度为负数;如果分布尾巴向右,偏度为正数。

偏度的计算公式

对于一组n个数据x1, x2, ..., xn的偏度S,它的计算公式为:

Skewness formula

其中,μ是平均数,s是标准差。

代码实现

Python中有几个库可以计算偏度,例如numpy库的skew()函数和scipy.stats库的skew()函数。这里以numpy为例:

import numpy as np

data = np.array([1, 2, 3, 4, 5])
skewness = np.skew(data)

print('Data: ', data)
print('Skewness: ', skewness)

输出结果:

Data:  [1 2 3 4 5]
Skewness:  0.0
结论

当数据分布对称时,偏度为0;当数据有偏时,偏度有正负之分,正数表示分布偏向右侧,负数表示偏向左侧。对于随机样本,样本的偏度可以用样本偏度来近似估计。在统计学和金融学中,偏度用于衡量风险和回报的不对称性。