《计算机应用》唯一官方网站 ›› 2024, Vol. 44 ›› Issue (6): 1855-1861.DOI: 10.11772/j.issn.1001-9081.2023050702
所属专题: 数据科学与技术
Xinrui LIN, Xiaofei WANG, Yan ZHU()
摘要:
学术社交网络中的某些学者可能组成异常引用群体,相互之间过度引用彼此的文章以谋取利益。现有的异常群体检测算法大多将社区检测与节点表示学习分离,导致最终异常群体检测性能受限。为此,提出一种基于局部扩展社区发现的异常引用群体检测(GADL)算法。所提算法利用论文研究领域、标题内容等语义信息提取作者异常引用特征;定义基于节点转移相似度、节点社区隶属度、引用异常度和广度优先遍历(BFS)深度的扩展度量函数;结合异常社区发现和异常节点检测,在统一框架下对二者联合优化,可获得最优的异常检测性能。在ACM、DBLP1和DBLP2数据集上,相较于ALP算法,所提算法分别提高了6.07%、5.35%和3.38%。在真实数据集上的实验结果表明,所提算法可有效地检测异常学术引用。
中图分类号: