📜  分位数分位数图

📅  最后修改于: 2022-05-13 01:58:08.517000             🧑  作者: Mango

分位数分位数图

分位数-分位数图是一种图形方法,用于确定两个数据样本是否来自同一总体。 qq 图是第一个数据集的分位数与第二个数据集的分位数的图。分位数是指低于给定值的点的分数(或百分比)。

出于参考目的,还绘制了一条 45% 的线,如果样本来自同一总体,则点沿着这条线。

正态分布:

正态分布(又名高斯分布/贝尔曲线)是一种连续概率分布,表示从随机生成的真实值中获得的分布。

{\displaystyle f(x)={\frac {1}{\sigma {\sqrt {2\pi }}}}e^{-{\frac {1}{2}}\left({\frac {x-\mu }{\sigma }}\right)^{2}}}

f(x) = Probability \, Distribution \, Function \\ \mu = mean \\ \sigma = standard \, deviation



下面是代表不同标准偏差的部分数据

曲线下面积的正态分布

用法:

分位数-分位数图用于以下目的:

  • 确定两个样本是否来自同一总体。
  • 两个样本是否有相同的尾巴
  • 两个样本是否具有相同的分布形状。
  • 两个样本是否有共同的定位行为。

QQ图怎么画

  • 收集用于绘制分位数-分位数图的数据。
  • 按升序或降序对数据进行排序。
  • 绘制正态分布曲线。
  • 找到每个线段的 z 值(截止点)。
  • 针对标准化截止点绘制数据集值。

QQ图的优势

  • 由于QQ图就像概率图。因此,在比较两个数据集时,样本大小不必相等。
  • 由于我们需要对数据集进行归一化,所以我们不需要关心值的维度。

QQ图的类型

  • 对于左尾分布:以下是

  • 对于均匀分布:以下是均匀分布的 qq 图分布:

均匀分布QQ图


Python代码实现
# code
import scipy.stats as stats
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
  
n = 2000
observation = np.random.binomial(n, 0.53, size=1000)/n
  
z = (observation-np.mean(observation))/np.std(observation)
  
stats.probplot(z, dist="norm", plot=plt)
plt.title("Normal Q-Q plot")
plt.show()

输出:

普通QQ图