分位数分位数图
分位数-分位数图是一种图形方法,用于确定两个数据样本是否来自同一总体。 qq 图是第一个数据集的分位数与第二个数据集的分位数的图。分位数是指低于给定值的点的分数(或百分比)。
出于参考目的,还绘制了一条 45% 的线,如果样本来自同一总体,则点沿着这条线。
正态分布:
正态分布(又名高斯分布/贝尔曲线)是一种连续概率分布,表示从随机生成的真实值中获得的分布。
下面是代表不同标准偏差的部分数据
用法:
分位数-分位数图用于以下目的:
- 确定两个样本是否来自同一总体。
- 两个样本是否有相同的尾巴
- 两个样本是否具有相同的分布形状。
- 两个样本是否有共同的定位行为。
QQ图怎么画
- 收集用于绘制分位数-分位数图的数据。
- 按升序或降序对数据进行排序。
- 绘制正态分布曲线。
- 找到每个线段的 z 值(截止点)。
- 针对标准化截止点绘制数据集值。
QQ图的优势
- 由于QQ图就像概率图。因此,在比较两个数据集时,样本大小不必相等。
- 由于我们需要对数据集进行归一化,所以我们不需要关心值的维度。
QQ图的类型
- 对于左尾分布:以下是
- 对于均匀分布:以下是均匀分布的 qq 图分布:
Python代码实现
# code
import scipy.stats as stats
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
n = 2000
observation = np.random.binomial(n, 0.53, size=1000)/n
z = (observation-np.mean(observation))/np.std(observation)
stats.probplot(z, dist="norm", plot=plt)
plt.title("Normal Q-Q plot")
plt.show()
输出: