📜  毫升 |聚类中的链接类型

📅  最后修改于: 2022-05-13 01:54:32.497000             🧑  作者: Mango

毫升 |聚类中的链接类型

先决条件:层次聚类

层次聚类的过程包括以自下而上的方式将子聚类(第一次迭代中的数据点)聚类成较大的聚类,或者以自上而下的方式将较大的聚类划分为较小的子聚类。在这两种层次聚类中,都需要计算两个子聚类之间的距离。不同类型的链接描述了测量两个数据点子集群之间距离的不同方法。不同类型的链接是:-

1.单链接:对于两个簇 R 和 S,单链接返回两点 i 和 j 之间的最小距离,使得 i 属于 R,j 属于 S。

L(R, S) = min(D(i, j)), i\epsilon R, j\epsilon S

2.完全链接:对于两个簇R和S,完全链接返回两点i和j之间的最大距离,使得i属于R,j属于S。

L(R, S) = max(D(i, j)), i\epsilon R, j\epsilon S

3.平均链接:对于两个簇R和S,首先计算R中任何数据点i与S中任何数据点j之间的距离,然后计算这些距离的算术平均值。平均链接返回算术平均值的这个值。

L(R, S) = \frac{1}{n_{R}+n_{S}}\sum _{i=1}^{n_{R}}\sum _{j=1}^{n_{S}} D(i, j), i\epsilon R, j\epsilon S

在哪里

n_{R} – R 中的数据点数

n_{S} – S 中的数据点数