期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于自适应差分隐私与客户选择优化的联邦学习方法
徐超, 张淑芬, 陈海田, 彭璐璐, 张帅华
《计算机应用》唯一官方网站    2025, 45 (2): 482-489.   DOI: 10.11772/j.issn.1001-9081.2024020162
摘要146)   HTML2)    PDF (2308KB)(813)    收藏

将差分隐私应用于联邦学习的方法是保护训练数据隐私的关键技术之一。针对之前多数工作未考虑参数的异质性,对训练参数均匀裁剪使每轮加入的噪声都是均匀的,从而影响模型收敛和训练参数质量的问题,提出一种基于梯度裁剪的自适应噪声添加方案。考虑梯度的异质性,在不同轮次为不同客户端执行自适应的梯度裁剪,从而使噪声大小自适应调整;同时,为进一步提升模型性能,对比传统的客户端随机采样方式,提出一种结合轮盘赌与精英保留的客户端采样方法。结合上述2种方法,提出一种结合客户端选择的自适应差分隐私联邦学习(CS&AGC DP_FL)方法。实验结果表明,在隐私预算为0.5时,相较于自适应差分隐私的联邦学习方法(Adapt DP_FL),所提方法能在相同级别的隐私约束下使最终的模型分类准确率提升4.9个百分点,并且在收敛速度方面,所提方法相较于对比方法进入收敛状态所需的轮次减少了4~10轮。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 联邦学习的公平性综述
张淑芬, 张宏扬, 任志强, 陈学斌
《计算机应用》唯一官方网站    2025, 45 (1): 1-14.   DOI: 10.11772/j.issn.1001-9081.2023121881
摘要249)   HTML17)    PDF (907KB)(159)    收藏

联邦学习(FL)凭借分布式结构和隐私安全的优势快速发展,但大规模FL引发的公平性问题影响了FL系统的可持续性。针对FL的公平性问题,对近年FL公平性的研究工作进行了系统梳理和深度分析。首先,对FL的工作流程和定义进行了解释,总结了FL中的偏见和公平性概念;其次,详细归纳了FL公平性研究中常用的数据集,探讨了公平性研究所面临的挑战;最后,从数据源选择、模型优化、贡献评估和激励机制这4个方面归纳梳理了相关研究工作的优缺点、适用场景以及实验设置等,并展望了FL公平性未来的研究方向和趋势。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于半监督联邦学习的恶意流量检测模型
张帅华, 张淑芬, 周明川, 徐超, 陈学斌
《计算机应用》唯一官方网站    2024, 44 (11): 3487-3494.   DOI: 10.11772/j.issn.1001-9081.2023101500
摘要82)   HTML3)    PDF (748KB)(40)    收藏

恶意流量检测是应对网络安全挑战的关键技术之一。针对采用联邦学习进行恶意流量检测时,本地标记数据不足,非独立同分布(non-IID)导致协同训练模型性能下降的问题,构建一种基于半监督联邦学习的恶意流量检测模型。该模型借助伪标记和一致性正则化项的半监督学习技术,有效地从未标记数据中提取信息进行训练;同时,设计一种非线性函数,用于动态调整客户端本地有监督和无监督损失在聚合时的权重,以充分利用未标记数据,提高模型的准确性。为降低non-IID问题对全局模型性能的影响,提出一种联邦聚合算法FedLD (Federated-Loss-Data),通过结合训练损失和数据量的权重计算方法,自适应地调整全局模型聚合过程中各客户端模型的权重。实验结果表明,在NSL-KDD数据集上,所提模型在标记数据有限的情况下能够实现较高的检测准确率,与基线模型FedSem (Federated Semi-supervised)相比,检测准确率提升了4.11个百分点,在正常流量(Normal)、拒绝服务(DoS)攻击和探测(Probe)等类别上的召回率也提升了1.65~7.66个百分点,说明所提模型更适用于恶意流量检测领域。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 改进的联邦加权平均算法
罗长银, 王君宇, 陈学斌, 马春地, 张淑芬
《计算机应用》唯一官方网站    2022, 42 (4): 1131-1136.   DOI: 10.11772/j.issn.1001-9081.2021071264
摘要715)   HTML17)    PDF (468KB)(326)    收藏

针对基于层次分析改进的联邦平均算法在计算其数据质量时存在主观因素的影响,提出改进的联邦加权平均算法,从数据质量的角度来处理多源数据。首先,将训练样本划分为预训练样本与预测试样本;然后,使用初始全局模型在预训练数据上的精度作为该数据源的质量权重;最后,将质量权重引入到联邦平均算法中,重新进行全局模型中权重更新。仿真结果表明,在均等分割的数据集与非均等分割的数据集上,改进的联邦加权平均算法训练的模型与传统联邦平均算法训练的模型相比,准确率最高分别提升了1.59%和1.24%;改进的联邦加权平均算法训练的模型与传统整合多方数据再训练的模型相比,虽然准确率略有下降,但数据与模型的安全性有所提升。

图表 | 参考文献 | 相关文章 | 多维度评价
5. 基于密度峰值的混合型数据聚类算法设计
李晔, 陈奕延, 张淑芬
计算机应用    2018, 38 (2): 483-490.   DOI: 10.11772/j.issn.1001-9081.2017082053
摘要407)      PDF (1493KB)(408)    收藏
针对 k-prototypes算法无法自动识别簇数以及无法发现任意形状的簇的问题,提出一种针对混合型数据的新方法:寻找密度峰值的聚类算法。首先,把CFSFDP(Clustering by Fast Search and Find of Density Peaks)聚类算法扩展到混合型数据集,定义混合型数据对象之间的距离后利用CFSFDP算法确定出簇中心,这样也就自动确定了簇的个数,然后其余的点按照密度从大到小的顺序进行分配。其次,研究了该算法中阈值(截断距离)及权值的选取问题:对于密度公式中的阈值,通过计算数据场中的势熵来自动提取;对于距离公式中的权值,利用度量数值型数据集和分类型数据集聚类趋势的统计量来定义。最后通过在三个实际混合型数据集上的测试发现:与传统 k-prototypes算法相比,寻找密度峰值的聚类算法能有效提高聚类的精度。
参考文献 | 相关文章 | 多维度评价
6. 面向个性化与公平性的联邦学习算法fedPF
张宏扬 张淑芬 谷铮
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2024070934
预出版日期: 2024-11-19

7. 面向联邦学习的投毒攻击检测与防御机制
钟琪 张淑芬 张镇博 菅银龙 景忠瑞
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2025020146
预出版日期: 2025-04-24