检测社交网络上的顶级节点 – VoteRank 算法
检测社交网络中的重要节点是一个有趣的问题。它可用于使用各种度量来查找网络 y 上最有影响力的节点,例如它们在网络中的位置、它们的拓扑特征,如它们的度数和边权重。最著名的算法之一是 Google 的 PageRank。
该算法通过计算页面链接的数量和质量来将页面表征为节点,从而粗略估计网站的重要性。基本假设是更重要的网站可能会收到更多来自其他网站的链接。这是最流行的算法之一,用于查找有影响力的/首页/图像/节点以及 Google 索引的任何内容。因此,排序及其应用很普遍,该领域的主要工作是基于用于排序的密钥。在网络世界中,我们还没有确定一个独特的银色箭头作为用于此目的的钥匙。原因是并非所有情况都相同,并且并非所有指标都可以在不损害个人隐私的情况下安全确定。
Zhang et al (2016) 的建议是使用基于投票的系统创建基于邻居意见的算法。传统算法(如 K-shells 和度中心性)以及其他启发式方法(如爬山法)可能会遇到一些传播者靠得太近以至于它们重叠影响范围的可能性。 It is based on the fact that all nodes vote in a spreader in each turn, and the voting ability of neighbors of elected spreader will be decreased in subsequent turn.此外,投票支持当前领导人的选民投票能力下降。
要了解发生了什么,让我们回顾一下基本概念。
社交网络作为图表
很明显,社交网络可以被描述为图表。人们可以充当节点,他们的连接可以充当边缘。这些边可以加权或不加权,其中权重可以表示连接强度,并且可以是有向的或无向的,具体取决于连接是单向还是双向。
我们如何评估排名?
这确实是一个很好的问题!既然不能直接把算法放到平台上测试,那就用物理模拟吧。现在,通过该领域的广泛研究,研究人员表示确实可以模拟它。我们需要从生物学中借鉴一些想法!易感感染和恢复 (SIR) 是一种流行病传播模型,作者已将其用作在各种现实世界网络上进行模拟的基础。
听起来不错,我该如何开始?
您需要了解图形、图形搜索、表示、最短路径,并对求解数学微分方程感兴趣。要深入学习 Graphs 概念,我们建议阅读 GeeksForGeeks Graphs,对于代码部分,您可以参考 Python3 中的 Networkx。