摘要: 机器学习的性能随着数据规模的增长大幅提升。然而,数据隐私泄露问题和数据孤岛问题限制了集中式机器学习的数据来源。近年来,联邦学习成为解决机器学习中数据难以共享的新思路。联邦学习架构不需要多方共享数据资源,参与方在本地数据上训练局部模型,周期性的将参数上传至服务器更新全局模型,就可以获得在大规模全局数据上建立的机器学习模型。联邦学习架构具有数据隐私保护的特质,是未来大规模数据机器学习的新方案。然而,联邦学习架构提供的隐私保护机制不足,在模型训练阶段和模型预测阶段都可能导致数据隐私泄露。目前,强化联邦学习架构中的隐私保护机制已经成为新的研究热点。本文从联邦学习中存在的隐私泄露问题出发,探讨了联邦学习中的攻击模型与敏感信息泄露途径。重点综述了联邦学习中的几类隐私保护技术:以差分隐私为基础的隐私保护技术、以同态加密为基础的隐私保护技术、以安全多方计算为基础的隐私保护技术、以区块链为基础的隐私保护技术。最后,探讨了联邦学习中隐私保护中的若干关键问题,展望未来研究方向。