📅  最后修改于: 2023-12-03 15:27:36.881000             🧑  作者: Mango
统计学中的偏度是指一组数据分布的不对称性度量。通俗点说,就是数据在均值附近分布的程度。如果均值附近的分布是对称的,则偏度为0;如果分布尾巴向左,偏度为负数;如果分布尾巴向右,偏度为正数。
对于一组n个数据x1, x2, ..., xn的偏度S,它的计算公式为:
其中,μ是平均数,s是标准差。
Python中有几个库可以计算偏度,例如numpy
库的skew()
函数和scipy.stats
库的skew()
函数。这里以numpy
为例:
import numpy as np
data = np.array([1, 2, 3, 4, 5])
skewness = np.skew(data)
print('Data: ', data)
print('Skewness: ', skewness)
输出结果:
Data: [1 2 3 4 5]
Skewness: 0.0
当数据分布对称时,偏度为0;当数据有偏时,偏度有正负之分,正数表示分布偏向右侧,负数表示偏向左侧。对于随机样本,样本的偏度可以用样本偏度来近似估计。在统计学和金融学中,偏度用于衡量风险和回报的不对称性。