• • 下一篇
摘要: 摘 要: 对抗训练是保护分类模型免受对抗性攻击的有效防御方法。然而,由于在训练过程中生成强对抗样本的高成本,可能需要数量级的额外训练时间。为了克服这一限制,基于单步攻击的快速对抗训练已被探索。以往的工作从样本初始化、损失正则化和训练策略等不同角度对快速对抗训练进行了改进。然而,在处理大扰动预算时遇到了灾难性过拟合。基于数据增强与标签噪声的快速对抗训练方法被提出,以解决此困难。初始阶段,对原始样本执行多种图像转换,并引入随机噪声以实施数据增强;接着,少量标签噪声被注入;然后使用增强的数据生成对抗样本用于模型训练;最后,根据对抗鲁棒性测试结果自适应地调整标签噪声率。在CIFAR-10、CIFAR-100数据集上的全面实验结果表明,相较于FGSM-MEP,所提方法在大扰动预算条件下,在两个数据集上的AA上分别提升了4.63和5.38个百分点。经实验证明,新提出的方案可以有效地处理大的扰动预算下灾难性过拟合问题,并显著增强模型的对抗鲁棒性。
中图分类号: