📅  最后修改于: 2023-12-03 15:40:26.820000             🧑  作者: Mango
标准差是衡量一组数据离散程度的指标,通常用来度量数据分散的程度。在统计分析中,标准差一般是指样本标准差。
标准差的公式如下:
$$s = \sqrt{\frac{\sum_{i=1}^n(x_i-\overline{x})^2}{n-1}}$$
其中,$x_i$ 表示第 $i$ 个数据点,$\overline{x}$ 表示这些数据的均值,$n$ 表示数据的数量。
在 Python 统计分析中,我们可以使用 NumPy 库中的 std()
函数来计算样本标准差。
import numpy as np
data = [1, 2, 3, 4, 5]
std = np.std(data)
print(std)
上述代码将输出这组数据的样本标准差。
我们也可以对一个矩阵进行标准差计算:
data = [[1, 2], [3, 4], [5, 6]]
# 按行计算标准差
std = np.std(data, axis=0)
print(std)
# 按列计算标准差
std = np.std(data, axis=1)
print(std)
我们还可以使用 Pandas 库中的 std()
函数来计算标准差。Pandas 库支持对数据框、Series 等进行标准差计算。例如,我们可以对一个 DataFrame 进行标准差计算:
import pandas as pd
data = {
'apples': [1, 2, 3, 4, 5],
'oranges': [2, 4, 6, 8, 10]
}
df = pd.DataFrame(data)
std = df.std()
print(std)
上述代码将输出这个 DataFrame 的标准差。我们还可以指定 axis
参数对行或列进行标准差计算。
标准差是统计分析中常用的指标之一。Python 中 NumPy 和 Pandas 等库提供了方便的函数来计算标准差,使用起来简单方便。