P值
先决条件:假设检验
P 值用于在原假设 (h 0 ) 为真时查找极值。简而言之,它用于在假设检验期间拒绝或支持零假设。在数据科学中,它为自变量在预测因变量中的统计显着性提供了宝贵的见解。
使用 p 值:
在假设检验期间,我们假设显着性水平(α) ,通常为 5% (α = 0.05) 。它是当原假设为真时拒绝原假设的概率。据观察,p 值越低,拒绝原假设的概率越高。什么时候:
- p ≤ (α = 0.05) :拒绝 h 0 。
- p > (α = 0.05) :拒绝 h 1 (或接受 h 0 )
如果未指定显着性水平,请在解释结果时考虑以下一般推论。
- 如果 p > .10:不显着
- 如果 p ≤ .10:略显着
- 如果 p ≤ .05:显着
- 如果 p ≤ .001:非常显着
图示:
从图形上看,p 值位于任何置信区间的尾部。 【如图1所示】
假设检验中的 P 值:
下表显示了 p 值的重要性,并显示了假设检验期间发生的各种错误。 Truth /Decision Accept h0 Reject h0 h0 -> true Correct decision based Type I error (α) h0 -> false Type II error (β) Incorrect decision based
on the given p-value
(1-α)
on the given p-value
(1-β)
第一类错误:错误拒绝原假设。它由α (显着性水平)表示。
第二类错误:错误地接受原假设。用β (功率电平)表示
p 值的常见用途:
- 在正向和反向传播期间:在拟合模型(例如多元线性回归模型)时,我们使用 p 值来找到对预测输出有显着贡献的最重要变量。
- 各种药物的作用:它在医学研究领域被广泛用于确定任何药物的成分是否会对人类产生预期的影响。 P 值是一种非常强大的统计工具,用于假设检验。它在做出重要决策时提供了大量有价值的信息,例如进行商业智能推理或确定是否应将药物用于人类等。如有任何疑问/疑问,请在下面发表评论。