现实中,图结构数据广泛存在,然而,在实际应用中,这些数据常面临标注数据短缺的难题。图数据的小样本学习(FSL)方法旨在以较少的标注样本实现数据的分类。尽管这些方法在小样本节点分类(FSNC)任务上获得较好的性能,但还存在以下问题:高质量的标签数据难获取,参数初始化过程泛化能力不足,未能充分挖掘图中的拓扑结构信息。为解决这些问题,提出一种基于图数据增强的小样本节点分类模型(GDA-FSNC)。GDA-FSNC由4个模块构成:基于结构相似度的图数据预处理模块、参数初始化模块、参数微调模块和自适应伪标签生成模块。在图数据预处理模块中,通过基于结构相似度的邻接矩阵增强方法获取更多的图结构信息;在参数初始化模块中,使用互相教学的数据增强方法使每个模型都能从其他模型学到不同的模式和特征,增强信息的多样性;在自适应伪标签生成模块中,根据不同数据集的特征自动选择合适的伪标签生成技术,以生成高质量的伪标签数据。在7个真实数据集上的实验结果表明,GDA-FSNC的分类准确率超过了Meta-GNN、GPN(Graph Prototypical Network)、IA-FSNC(Information Augmentation for Few-Shot Node Classification)等主流的FSL模型。例如,相较于基线模型IA-FSNC,所提模型的分类准确率在小数据集2-way 1-shot设置下至少提升了0.27个百分点,在大数据集5-way 1-shot设置下至少提升了2.06个百分点。可见,GDA-FSNC在小样本场景下有更好的分类性能和泛化能力。