基于相似度聚类和正则化的个性化联邦学习

doi:10.11772/j.issn.1001-9081.2023111693

• •

基于相似度聚类和正则化的个性化联邦学习

巫婕¹,钱雪忠²,宋威¹

1. 江南大学
2. 江苏省无锡市江南大学蠡湖校区桂园9#521

收稿日期:2023-12-06 修回日期:2024-03-06 发布日期:2024-03-22
通讯作者: 巫婕
基金资助:
国家自然科学基金

Personalized federated learning based on similarity clustering and regularization

Received:2023-12-06 Revised:2024-03-06 Online:2024-03-22
Supported by:
the National Natural Science Foundation of China

摘要/Abstract

摘要： 联邦学习应用场景中，常面临客户端数据异质性和不同任务需求需要提供个性化模型的问题，而现有的部分个性化联邦学习中存在个性化与全局泛化的权衡问题，并且采用传统FL中根据客户端数据量加权聚合，导致数据分布差异大的客户端模型性能变差，缺乏个性化聚合策略。针对上述问题，提出一种新的个性化联邦学习方法（pFedSCR）。pFedSCR算法在客户端本地更新阶段训练个性化模型和局部模型，个性化模型在交叉熵损失函数引入L2范数正则化，动态调整参考全局模型的程度，在汲取全局知识的基础上实现个性化；在服务端聚合阶段，根据客户端模型更新的相似度聚类，构建相似度矩阵，动态调整聚合权重为不同客户端聚合个性化模型，让参数聚合策略具有个性化的同时缓解了数据异构问题。实验结果表明，在CIFAR-10，MNIST等三种数据集上通过Dirichlet 分布模拟了多种Non-IID数据场景，pFedSCR算法在各种场景下的精度和通信效率都优于经典算法（FedProx）和最新个性化算法（FedPCL）等FL算法，最高可达到99.03%准确率。

关键词: 联邦学习, 非独立同分布, 余弦相似度, 正则化, 个性化联邦学习, 隐私安全

Abstract: Federated learning scenarios often face the problem of data heterogeneity and the need to provide personalized models for different task requirements. However, there is a trade-off between personalization and global generalization in some existing personalized federated learning. Most of them use traditional FL based on client data. Quantity-weighted aggregation, aggregation weights lack personalization. In response to the above problems, a personalized federated learning method (pFedSCR) based on similarity clustering and regularization is proposed. The pFedSCR algorithm trains the private model in the client's local update phase, introduces L2 norm regularization, and dynamically controls the extent to which the private model refers to the global model; in the server aggregation phase, it clusters based on the client model similarity and dynamically adjusts the client aggregation weight as Different clients aggregate personalized models. Experimental results show that non-IID data scenarios are simulated through Dirichlet distribution on three data sets such as CIFAR-10. Compared with five algorithms including the classic algorithm Fedprox and the latest personalized algorithm fedpcl, the pFedSCR algorithm can perform well in various scenarios. Get higher accuracy, up to 99.03% test accuracy.

Key words: Federated Learning (FL), Non-Independent Identical Distribution (Non-IID), Cosine Similarity, regularization, Personalized Federated Learning(PFL), privacy security

中图分类号:

TP391

巫婕钱雪忠宋威. 基于相似度聚类和正则化的个性化联邦学习[J]. 计算机应用, DOI: 10.11772/j.issn.1001-9081.2023111693.

[1]	余孙婕, 曾辉, 熊诗雨, 史红周. 基于生成式对抗网络的联邦学习激励机制[J]. 《计算机应用》唯一官方网站, 2024, 44(2): 344-352.
[2]	周辉, 陈玉玲, 王学伟, 张洋文, 何建江. 基于生成对抗网络的联邦学习深度影子防御方案[J]. 《计算机应用》唯一官方网站, 2024, 44(1): 223-232.
[3]	蓝梦婕, 蔡剑平, 孙岚. 非独立同分布数据下的自正则化联邦学习优化方法[J]. 《计算机应用》唯一官方网站, 2023, 43(7): 2073-2081.
[4]	陈宛桢, 张恩, 秦磊勇, 洪双喜. 边缘计算下基于区块链的隐私保护联邦学习算法[J]. 《计算机应用》唯一官方网站, 2023, 43(7): 2209-2216.
[5]	林尚静, 马冀, 庄琲, 李月颖, 李子怡, 李铁, 田锦. 基于联邦学习的无线通信流量预测[J]. 《计算机应用》唯一官方网站, 2023, 43(6): 1900-1909.
[6]	郝劭辰, 卫孜钻, 马垚, 于丹, 陈永乐. 基于高效联邦学习算法的网络入侵检测模型[J]. 《计算机应用》唯一官方网站, 2023, 43(4): 1169-1175.
[7]	尹春勇, 屈锐. 基于个性化差分隐私的联邦学习算法[J]. 《计算机应用》唯一官方网站, 2023, 43(4): 1160-1168.
[8]	王腾, 霍峥, 黄亚鑫, 范艺琳. 联邦学习中的隐私保护技术研究综述[J]. 《计算机应用》唯一官方网站, 2023, 43(2): 437-449.
[9]	李文博, 刘波, 陶玲玲, 罗棻, 张航. L1正则化的深度谱聚类算法[J]. 《计算机应用》唯一官方网站, 2023, 43(12): 3662-3667.
[10]	陈谦, 柴政, 王子龙, 陈嘉伟. 基于生成对抗网络的联邦学习中投毒攻击检测方案[J]. 《计算机应用》唯一官方网站, 2023, 43(12): 3790-3798.
[11]	耿方兴, 李卓, 陈昕. 基于多领导者Stackelberg博弈的分层联邦学习激励机制设计[J]. 《计算机应用》唯一官方网站, 2023, 43(11): 3551-3558.
[12]	郑赛, 李天瑞, 黄维. 面向通信成本优化的联邦学习算法[J]. 《计算机应用》唯一官方网站, 2023, 43(1): 1-7.
[13]	刘炎培, 陈宁宁, 朱运静, 王丽萍. 面向5G/Beyond 5G的移动边缘缓存优化技术综述[J]. 《计算机应用》唯一官方网站, 2022, 42(8): 2487-2500.
[14]	章振宇, 谭国平, 周思源. 基于1‑bit压缩感知的高效无线联邦学习算法[J]. 《计算机应用》唯一官方网站, 2022, 42(6): 1675-1682.
[15]	罗长银, 王君宇, 陈学斌, 马春地, 张淑芬. 改进的联邦加权平均算法[J]. 《计算机应用》唯一官方网站, 2022, 42(4): 1131-1136.

基于相似度聚类和正则化的个性化联邦学习

Personalized federated learning based on similarity clustering and regularization

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics