《计算机应用》唯一官方网站 ›› 2026, Vol. 46 ›› Issue (5): 1475-1481.DOI: 10.11772/j.issn.1001-9081.2025050656
• 数据科学与技术 • 上一篇
Fengwei CHENG1, Bingqi ZHANG2, Guohua XU1, Wenjian WANG2,3(
)
摘要:
图神经网络(GNN)在节点分类任务中取得了显著成功,但它的性能通常依赖多数类丰富的标记数据,对标记稀缺的少数类节点可能存在表征偏差。传统过采样方法通过重复少数类样本可缓解类别不均衡,但容易导致局部邻域过拟合。近期研究尝试基于少数类锚点合成新节点,但未充分挖掘少数类与邻近类之间的关联信息,导致生成样本存在类边界模糊性问题。针对上述挑战,提出一种竞争损失驱动的生成式不平衡节点分类算法(GraphCG),设计特征-结构协同的辅助点筛选机制,通过融合节点特征与局部结构,精准定位可增强类边界的邻居类辅助点,并构造竞争性边界约束损失函数,以强制生成节点与多数类在嵌入空间中保持可分离的几何边界。实验结果表明,相较于当前的先进方法,GraphCG在多个类别不平衡数据集上表现出显著优势。GraphCG不仅可以增强数据的多样性,还可以提升类别可分性,避免少数类被多数类压制。
中图分类号: