📜  Parzen Windows 密度估计技术

📅  最后修改于: 2022-05-13 01:57:01.776000             🧑  作者: Mango

Parzen Windows 密度估计技术

Parzen Window是一种非参数密度估计技术。模式识别中的密度估计可以通过使用 Parzen Windows 的方法来实现。 Parzen窗口密度估计技术是直方图技术的一种推广。

它用于导出密度函数, { f(x)  .
{ f(x)  用于实现贝叶斯分类器。当我们有一个新的样本特征时x  当需要计算类条件密度的值时, { f(x)  用来。
{ f(x)  获取样本输入数据值并返回给定数据样本的密度估计。

考虑一个 n 维超立方体,假设它拥有 k 个数据样本。
假设超立方体的边长为 h n

因此超立方体的体积为: V n = h n d

我们定义了一个超立方体窗口函数φ(u) ,它是一个以原点为中心的单位超立方体的指示函数:
φ(u) = 1如果 |u i | <= 0.5
φ(u) = 0否则
这里,u 是一个向量, u = (u 1 , u 2 , ..., u d ) T
φ(u)应满足以下条件:

  1. \varphi\((u) >= 0 ; \forall u
  2. \int_{R^{d}}^{} \varphi\((u).du = 1

V = \int_{R^{d}}^{} \varphi\( \frac{u}{h} \))du = \int_{R^{d}}^{} \varphi\ (\frac{u-u_{0}}{h} \))du

由于 φ(u) 以原点为中心,因此它是对称的。
φ(u) = φ(-u)

  • \varphi\(\frac{(u-u_{0})}{h}\)  是一个大小为 h 的超立方体,以u 0为中心
  • 令 D = {x 1 , x 2 , ..., x n }为数据样本。
  • 对于任何x, \varphi\(\frac{(x-x_{i})}{h}\)  只有当x_{i}  落在一个超立方体的边上h  x  .
  • 因此,落在以 x 为中心的 h 侧超立方体中的数据点数为k =\(\sum_{i=1}^{n}\varphi\(\frac{(x-x_{i})}{h}\)

因此估计的密度函数为:

*** QuickLaTeX cannot compile formula:
 

*** Error message:
Error: Nothing to show, formula is empty

此外,由于V n = h n d ,密度函数变为:
{\LARGE f(x) = \( \frac{1}{n} \) \(\sum_{i=1}^{n}\) \( \frac{1}{V} \) \varphi\(\frac{(x-x_{i})}{h}\) }

f(x)  将满足以下条件:

  1. f(x) >= 0 ; \forall x
  2. \int_{}^{} f(x).dx = 1