毫升 |聚类中的链接类型
先决条件:层次聚类
层次聚类的过程包括以自下而上的方式将子聚类(第一次迭代中的数据点)聚类成较大的聚类,或者以自上而下的方式将较大的聚类划分为较小的子聚类。在这两种层次聚类中,都需要计算两个子聚类之间的距离。不同类型的链接描述了测量两个数据点子集群之间距离的不同方法。不同类型的链接是:-
1.单链接:对于两个簇 R 和 S,单链接返回两点 i 和 j 之间的最小距离,使得 i 属于 R,j 属于 S。
2.完全链接:对于两个簇R和S,完全链接返回两点i和j之间的最大距离,使得i属于R,j属于S。
3.平均链接:对于两个簇R和S,首先计算R中任何数据点i与S中任何数据点j之间的距离,然后计算这些距离的算术平均值。平均链接返回算术平均值的这个值。
在哪里
– R 中的数据点数
– S 中的数据点数