《计算机应用》唯一官方网站

Select

1. 基于多域特征提取的多变量时间序列异常检测

赵培, 乔焰, 胡荣耀, 袁新宇, 李敏悦, 张本初

《计算机应用》唯一官方网站 2024, 44 (11): 3419-3426. DOI: 10.11772/j.issn.1001-9081.2023111636

摘要（297）

HTML （4）

PDF （754KB）（1878）

PDF（mobile）（1807KB）（24）

多变量时间序列（MTS）数据具有高维性，且分布复杂多变，现有的异常检测模型在面对MTS数据集时普遍存在误判率高、训练困难等问题，且多数模型仅考虑时间序列样本的时空特征，对时间序列特征的学习并不全面。为了解决以上问题，提出一种基于多域特征提取的MTS异常检测模型（MFE-TS）。首先，从原始数据域出发，使用长短期记忆（LSTM）网络与卷积神经网络（CNN）分别提取MTS的时间相关性和空间相关性特征。其次，用傅里叶变换将原始时间序列转换到频域空间，并利用Transformer学习数据在频域空间的幅度与相位特征。多域特征学习能更全面地建模时间序列特征，从而提高模型对MTS的异常检测性能。此外，引入掩码策略，进一步增强模型的特征学习能力，并使模型具备一定的抗噪性。实验结果表明，MFE-TS在多个真实MTS数据集上展现了优越的性能，同时在含有噪声的数据集中仍能保持较好的检测效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于深度学习的网络入侵检测系统综述

邓淼磊, 阚雨培, 孙川川, 徐海航, 樊少珺, 周鑫

《计算机应用》唯一官方网站 2025, 45 (2): 453-466. DOI: 10.11772/j.issn.1001-9081.2024020229

摘要（282）

HTML （31）

PDF （1427KB）（1798）

入侵检测系统（IDS）等安全机制已被用于保护网络基础设施和网络通信免受网络攻击。随着深度学习技术的不断进步，基于深度学习的IDS逐渐成为网络安全领域的研究热点。通过对文献广泛调研，详细介绍利用深度学习技术进行网络入侵检测的最新研究进展。首先，简要概述当前几种IDS；其次，介绍基于深度学习的IDS中常用的数据集和评价指标；然后，总结网络IDS中常用的深度学习模型及其应用场景；最后，探讨当前相关研究面临的问题，并提出未来的发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于Lobatto方法和Legendre多项式的PINN求解微分代数方程

赖帅, 唐卷, 梁锟, 陈佳盛

《计算机应用》唯一官方网站 2025, 45 (3): 911-919. DOI: 10.11772/j.issn.1001-9081.2024030313

摘要（155）

HTML （1）

PDF （2186KB）（1768）

当前求解微分代数方程（DAE）的神经网络方法基本都采用数据驱动策略，需要大量的数据集，因此存在对神经网络的结构和参数选择敏感、求解结果精度低、稳定性差等问题。针对这些问题，提出一种基于Lobatto方法和Legendre多项式的物理信息神经网络（LL-PINN）。首先，基于离散型物理信息神经网络（PINN）的计算框架，结合Lobatto IIIA方法求解DAE高精度和高稳定性的优点，将DAE的物理信息嵌入Lobatto IIIA时间迭代格式中，并使用PINN对该时间迭代进行近似数值求解；其次，采用单隐藏层的神经网络结构，利用勒让德多项式展开项的逼近能力，应用这些多项式作为激活函数来简化网络模型调整的过程；最后，采用时间区域分解方案构建网络模型，即对每个等分的子时间区域依次使用一个微分神经网络和一个代数神经网络，从而实现DAE的高精度连续时间预测。数值算例结果表明，基于勒让德多项式和4阶的Lobatto方法的LL-PINN实现了对DAE的高精度求解。与函数连接理论（TFC）试验解模型和PINN模型相比，LL-PINN的微分变量和代数变量的预测解与精确解的绝对误差显著降低，精度提高了一个或两个量级。因此，所提求解模型对求解DAE问题具有较好的计算精度，可为解决具有挑战性的偏DAE提供可行的解决方案。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 面向数据异构的聚类联邦学习算法

陈庆礼, 郭渊博, 方晨

《计算机应用》唯一官方网站 2025, 45 (4): 1086-1094. DOI: 10.11772/j.issn.1001-9081.2024010132

摘要（168）

HTML （9）

PDF （2335KB）（1719）

联邦学习（FL）是一种在隐私保护和通信效率方面极具潜力的新型机器学习模型构建范式，然而现实物联网（IoT）场景中客户端节点数据之间会存在异构性，学习一个统一的全局模型会导致模型准确率下降。为了解决这一问题，提出一种基于特征分布的聚类联邦学习（CFLFD）算法。在该算法中，对每个客户端节点从模型提取的特征进行主成分分析（PCA）后所得到的结果进行聚类，以将具有相似数据分布的客户端节点聚类在一起相互协作，从而提高模型准确率。为验证算法的有效性，在3个数据集和4种基准算法上进行大量实验。实验结果表明，与FedProx相比，CFLFD算法在CIFAR10数据集和Office-Caltech10数据集上将模型准确率分别提升了1.12和3.76个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 应对零日攻击的混合车联网入侵检测系统

方介泼, 陶重犇

《计算机应用》唯一官方网站 2024, 44 (9): 2763-2769. DOI: 10.11772/j.issn.1001-9081.2023091328

摘要（361）

HTML （14）

PDF （2618KB）（1650）

现有机器学习方法在面对零日攻击检测时，存在对样本数据过度依赖以及对异常数据不敏感的问题，从而导致入侵检测系统（IDS）难以有效防御零日攻击。因此，提出一种基于Transformer和自适应模糊神经网络推理系统（ANFIS）的混合车联网入侵检测系统。首先，设计了一种数据增强算法，通过先去除噪声再生成的方法解决了数据样本不平衡的问题；其次，将非线性特征交互引入复杂的特征组合，设计了一个特征工程模块；最后，将Transformer的自注意力机制和ANFIS的自适应学习方法相结合，以提高特征表征能力，减少对样本数据的依赖。在CICIDS-2017和UNSW-NB15入侵数据集上将所提系统与Dual-IDS等先进（SOTA）算法进行比较。实验结果表明，对于零日攻击，所提系统在CICIDS-2017入侵数据集上实现了98.64%的检测精确率和98.31%的F1值，在UNSW-NB15入侵数据集上实现了93.07%的检测精确率和92.43%的F1值，验证了所提算法在零日攻击检测方面的高准确性和强泛化能力。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 基于Attention-1DCNN-CE的加密流量分类方法

耿海军, 董赟, 胡治国, 池浩田, 杨静, 尹霞

《计算机应用》唯一官方网站 2025, 45 (3): 872-882. DOI: 10.11772/j.issn.1001-9081.2024030325

摘要（123）

HTML （3）

PDF （2750KB）（1608）

针对传统加密流量识别方法存在多分类准确率低、泛化性不强以及易侵犯隐私等问题，提出一种结合注意力机制（Attention）与一维卷积神经网络（1DCNN）的多分类深度学习模型——Attention-1DCNN-CE。该模型包含3个核心部分：1）数据集预处理阶段，保留原始数据流中数据包间的空间关系，并根据样本分布构建成本敏感矩阵；2）在初步提取加密流量特征的基础上，利用Attention和1DCNN模型深入挖掘并压缩流量的全局与局部特征；3）针对数据不平衡这一挑战，通过结合成本敏感矩阵与交叉熵（CE）损失函数，显著提升少数类别样本的分类精度，进而优化模型的整体性能。实验结果表明，在BOT-IOT和TON-IOT数据集上该模型的整体识别准确率高达97%以上；并且该模型在公共数据集ISCX-VPN和USTC-TFC上表现优异，在不需要预训练的前提下，达到了与ET-BERT（Encrypted Traffic BERT）相近的性能；相较于PERT（Payload Encoding Representation from Transformer），该模型在ISCX-VPN数据集的应用类型检测中的F1分数提升了29.9个百分点。以上验证了该模型的有效性，为加密流量识别和恶意流量检测提供了解决方案。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 基于语音和文本的双模态情感识别综述

韩令敏, 陈仙红, 熊文梦

《计算机应用》唯一官方网站 2025, 45 (4): 1025-1034. DOI: 10.11772/j.issn.1001-9081.2024030319

摘要（420）

HTML （62）

PDF （1625KB）（1597）

情感识别是一种让计算机识别和理解人类情感的技术，在众多领域都起着重要的作用，也是人工智能领域重要的发展方向。因此，梳理与归纳基于语音和文本的双模态情感识别的研究现状：首先，分类阐述情感表示空间；其次，按照情感数据库的情感表示空间对这些数据库进行分类，并总结常见的多模态情感数据库；再次，介绍基于语音和文本的双模态情感识别方法，包括特征提取、模态融合和决策分类，重点介绍模态融合方法并将这些方法分为特征级融合、决策级融合、模型级融合和多层次融合这4类；此外，比较和分析一系列语音和文本双模态情感识别方法的结果；最后，介绍情感识别的应用场景、面临的挑战与未来的发展方向。以上旨在对多模态情感识别，尤其是对基于语音和文本的双模态情感识别的相关工作进行分析与总结，并为情感识别提供有价值的参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

8. 基于概率稀疏自注意力神经网络的重性抑郁疾患诊断

秦璟, 秦志光, 李发礼, 彭悦恒

《计算机应用》唯一官方网站 2024, 44 (9): 2970-2974. DOI: 10.11772/j.issn.1001-9081.2023091371

摘要（285）

HTML （8）

PDF （1067KB）（1581）

抑郁症的诊断主要依赖于医师的咨询和量表评估等主观方法，可能导致误诊。脑电图（EEG）具有高时间分辨率、低成本、易于设置和无创等优点，因此可以用作精神障碍（如抑郁症）的定量测量工具。深度学习算法目前在EEG信号上有多种应用，其中就包括抑郁症的诊断和分类。EGG信号在通过自注意力机制处理时有大量的冗余部分，因此，提出一种基于概率稀疏自注意力机制的卷积神经网络（PSANet）。首先，根据采样因数在自注意力机制中选取少量最关键的注意力点，在运用自注意力机制的同时克服它计算成本高的缺点，使它可以在脑电长序列数据上应用；同时将脑电图与患者的生理量表进行嵌合，从而进行多维度诊断。在一个包含抑郁症患者和健康对照组的数据集上进行实验评估，实验结果表明，PSANet表现出较高的分类准确性，参数量也低于EEGNet等对比方法。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

9. 知识图谱在装备故障诊断领域的研究与应用综述

武杰, 张安思, 吴茂东, 张仪宗, 王从宝

《计算机应用》唯一官方网站 2024, 44 (9): 2651-2659. DOI: 10.11772/j.issn.1001-9081.2023091280

摘要（586）

HTML （53）

PDF （2858KB）（1545）

知识图谱从装备故障诊断数据中提取有用的知识，通过（实体，关系，实体）的三元组方式，对复杂装备的故障诊断信息进行有效管理，实现装备故障的快速诊断。首先，介绍装备故障诊断知识图谱的相关概念，分析装备故障诊断领域知识图谱的构建框架；其次，归纳国内外装备故障诊断知识图谱的知识抽取、知识融合以及知识推理等几个关键技术的研究现状；最后，对目前装备故障诊断知识图谱应用进行总结，提出该领域知识图谱构建的不足和面临的挑战，并对未来装备故障诊断领域提供一些新的思路。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

10. 基于丰度协调技术的企业ESG指标预测模型

李严, 叶冠华, 李雅文, 梁美玉

《计算机应用》唯一官方网站 2025, 45 (2): 670-676. DOI: 10.11772/j.issn.1001-9081.2024030262

摘要（127）

HTML （5）

PDF （1400KB）（1536）

环境、社会及治理（ESG）指标是评估企业可持续发展的重要指标。现有的ESG评估体系存在覆盖范围狭窄、主观性强和时效性差等问题，因此，迫切需要研究能利用企业数据准确预测ESG指标的预测模型。针对企业数据中ESG关联特征存在信息丰度不一致的问题，提出一种基于丰度协调技术的企业ESG指标预测模型RCT （Richness Coordination Transformer），其中上游丰度协调模块通过自编码器协调异质丰度特征，从而提高下游模块的ESG指标预测性能。在真实数据集上的实验结果表明，与模型时间卷积网络（TCN）、长短期记忆（LSTM）网络、自注意力模型（Transformer）、极限梯度提升（XGBoost）和轻量级梯度提升机（LightGBM）相比，RCT模型在各项预测指标上均表现最优，验证了RCT模型在预测ESG指标上的有效性和优越性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

11. APK-CNN和Transformer增强的多域虚假新闻检测模型

李金金, 桑国明, 张益嘉

《计算机应用》唯一官方网站 2024, 44 (9): 2674-2682. DOI: 10.11772/j.issn.1001-9081.2023091359

摘要（338）

HTML （17）

PDF （1378KB）（1520）

为解决社交媒体新闻中的领域转移、领域标签不完整问题，以及探索更高效的多域新闻文本特征提取和融合网络，提出一种基于APK-CNN（Adaptive Pooling Kernel Convolutional Neural Network）和Transformer增强的多域虚假新闻检测模型Transm3。首先，设计三通道网络对文本的语义、情感和风格信息进行特征提取和表示，并利用多粒度跨域交互器对这些特征进行视图组合；其次，通过优化的软共享内存网络和域适配器来完善新闻领域标签；再次，将Transformer与多粒度跨域交互器结合，使用更先进的融合网络动态加权聚合不同领域的交互特征；最后，将融合特征输入分类器中用于真/假新闻判别。实验结果表明，Transm3与M³FEND（Memory-guided Multi-view Multi-domain FakE News Detection）和EANN（Event Adversarial Neural Networks for multi-modal fake news detection）相比，综合F1值在中文数据集上分别提高了3.68%和6.46%，在英文数据集上分别提高了6.75%和11.93%，在各分领域上F1值也有明显的提高，充分验证了Transm3在多域虚假新闻检测工作上的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

12. 基于改进YOLOv8的轻量级大幅面瓷砖缺陷检测算法

余松森, 林智凡, 薛国鹏, 徐建宇

《计算机应用》唯一官方网站 2025, 45 (2): 647-654. DOI: 10.11772/j.issn.1001-9081.2024020198

摘要（151）

HTML （20）

PDF （3856KB）（1508）

针对当前瓷砖缺陷检测主要依靠人工检测导致的主观性强、效率低、劳动强度大等问题，提出一种基于改进YOLOv8的轻量级大幅面瓷砖图像微小缺陷检测算法。首先，对高分辨率大幅面图像进行裁切处理，并在骨干网络中引入HorBlock增强模型的捕捉能力；其次，融入大型可分离内核注意力（LSKA）改进C2f提高模型的检测性能，并通过引入SA（Shuffle Attention）增强模型的特征提取能力；最后，引入全维度动态卷积（ODConv）进一步增强模型对微小缺陷的处理能力。在阿里天池瓷砖瑕疵检测数据集上的实验结果表明：改进后的模型不仅参数量比原始YOLOv8n低，而且mAP@0.5提升了8.2个百分点，F1分数提升了7个百分点。可见，改进后的模型能更精确地识别和处理大幅面瓷砖的微小表面缺陷，且能在保持轻量级的同时，显著提升检测效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

13. 基于解耦注意力机制的多变量时序预测模型

李力铤, 华蓓, 贺若舟, 徐况

《计算机应用》唯一官方网站 2024, 44 (9): 2732-2738. DOI: 10.11772/j.issn.1001-9081.2023091301

摘要（353）

HTML （11）

PDF （1545KB）（1423）

针对多变量时序预测难以充分利用序列上下文语义信息及变量间隐含关联信息的问题，提出一种基于解耦注意力机制的多变量时序预测模型Decformer。首先，提出一种解耦注意力机制，从而充分利用嵌入的语义信息提升注意力权值分配的准确度；其次，提出一种不依赖于显式变量关系的模式关联挖掘方法，以挖掘并利用变量间隐含的模式关联信息。在话务量、电力消耗和交通3种不同类型的真实数据集（TTV、ECL和PeMS-Bay）上，与长短期时间序列网络（LSTNet）、Transformer、FEDformer等优秀的开源多变量时序预测模型相比，Decformer在所有预测时间长度上都取得了最高的预测精度。相较于LSTNet，Decformer在TTV、ECL和PeMS-Bay数据集上的平均绝对误差（MAE）分别降低了17.73%~27.32%、10.89%~17.01%和13.03%~19.64%；均方误差（MSE）分别降低了23.53%~58.96%、16.36%~23.56%和15.91%~26.30%。实验结果表明，Decformer能够有效提升多变量时序预测的精度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

14. 基于解耦注意力与幻影卷积的轻量级人体姿态估计

陈俊颖, 郭士杰, 陈玲玲

《计算机应用》唯一官方网站 2025, 45 (1): 223-233. DOI: 10.11772/j.issn.1001-9081.2024010099

摘要（182）

HTML （4）

PDF （3442KB）（1322）

随着轻量级网络的发展，人体姿态估计任务得以在计算资源有限的设备上执行，然而，提升精度变得更具有挑战性。这些挑战主要源于网络复杂度与计算资源的矛盾，导致模型在简化时牺牲了表示能力。针对上述问题，提出一种基于解耦注意力和幻影卷积的轻量级人体姿态估计网络（DGLNet）。具体来说，DGLNet以小型高分辨率网络（Small HRNet）模型为基础架构，通过引入解耦注意力机制构建DFDbottleneck模块；采用shuffleblock的结构对基础模块进行重新设计，即用轻量级幻影卷积替代计算量大的点卷积，并利用解耦注意力机制增强模块性能，从而构建DGBblock模块；此外，用幻影卷积和解耦注意力重新构建的深度可分离卷积模块来替代原过渡层模块，从而构建GSCtransition模块，进一步减少计算量并增强特征交互性和提高性能。在COCO验证集上的实验结果显示，DGLNet优于轻量级高分辨率网络（Lite-HRNet），在计算量和参数量不增加的情况下，最高精度达到了71.9%；与常见的轻量级姿态估计网络MobileNetV2和ShuffleNetV2相比，DGLNet在仅使用21.2%和25.0%的计算量情况下分别实现了4.6和8.3个百分点的精度提升；在AP⁵⁰的评价标准上，DGLNet超过了大型高分辨率网络（HRNet）的同时计算量和参数量远小于HRNet。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

15. 多域时空层次图神经网络的空气质量预测

马汉达, 吴亚东

《计算机应用》唯一官方网站 2025, 45 (2): 444-452. DOI: 10.11772/j.issn.1001-9081.2024010064

摘要（157）

HTML （5）

PDF （3113KB）（1320）

在协同融合气象、空间和时间三大信息的时空混合模型中，时间变化建模通常在一维空间中完成。针对一维序列局限于滑动窗口和缺乏对多尺度特征的灵活提取的问题，提出一种多域时空层次图神经网络（MST-HGNN）模型。首先，构建城市全局尺度和站点局部尺度的两级层次图，从而进行空间关系学习；其次，将一维空气质量序列转换为一组基于多个周期的二维张量，并在二维空间上通过多尺度卷积进行周期解耦以捕获频域特征；同时，在一维空间中利用长短期记忆（LSTM）网络拟合时域特征；最后，为避免聚合冗余信息，设计一种门控机制融合模块用于频域和时域特征的多域特征融合。在Urban-Air数据集和长三角城市群数据集上的实验结果表明，相较于多视图多任务时空图卷积网络模型（M2），所提模型在预测第1 h、3 h、6 h、12 h空气质量的平均绝对误差（MAE）和均方根误差（RMSE）均低于对比模型。可见，MST-HGNN能在频域上解耦复杂时间模式，利用频域信息弥补时域特征建模的局限性，并结合时域信息更全面地预测空气质量变化。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

16. 融合1D-CNN与BiGRU的类不平衡流量异常检测

陈虹, 齐兵, 金海波, 武聪, 张立昂

《计算机应用》唯一官方网站 2024, 44 (8): 2493-2499. DOI: 10.11772/j.issn.1001-9081.2023081112

摘要（424）

HTML （4）

PDF （1194KB）（1264）

网络流量异常检测是利用各种检测技术分析判断网络流量，发现网络中潜在的攻击，是一种有效的网络安全防护方法。针对高维海量数据和不同攻击类别的网络流量数据不均衡而导致检测准确率低、误报率高的问题，提出一种融合一维卷积神经网络（1D-CNN）和双向门控循环单元（BiGRU）的类不平衡流量异常检测模型。首先，针对类不平衡数据，通过使用改进的合成少数类过采样技术（SMOTE）即Borderline-SMOTE和基于高斯混合模型（GMM）的欠采样聚类技术进行平衡处理；然后，使用1D-CNN提取数据的局部特征，并利用BiGRU更好地提取数据中的时序特征；最后，在UNSW-NB15数据集对所提模型进行验证，所提模型的准确率为98.12%，误报率为1.28%。结果表明，所提模型提高了对少数攻击的识别率，检测精度高于其他经典机器学习和深度学习模型。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

17. 基于多尺度门控膨胀卷积网络的时间序列预测算法

曾渝, 张洋, 曾尚, 付茂栗, 何启学, 曾林隆

《计算机应用》唯一官方网站 2024, 44 (11): 3427-3434. DOI: 10.11772/j.issn.1001-9081.2023111583

摘要（272）

HTML （7）

PDF （803KB）（1259）

针对当前时间序列预测任务存在的高维特征、大规模数据以及对预测准确性高要求等问题，提出一种基于多尺度趋势-周期分解的多头门控膨胀卷积网络模型。该模型采用多尺度分解方法，将原始协变量序列和预测变量序列分解为各自的周期项和趋势项，从而实现独立的预测。对于周期项，引入多头门控膨胀卷积网络的编码器，以提取各自的周期信息；在解码器阶段，使用交叉注意力机制进行通道信息的交互融合，并将预测变量的周期信息采样对齐后通过时间注意力与通道融合信息进行周期预测。对趋势项则采用自回归方式进行趋势预测。最后将趋势预测与周期预测的结果相加得到预测序列。与长短期记忆（LSTM）、Informer等多个主流基准模型进行比较，所提模型在ETTm1、ETTh1等5个数据集上的均方误差（MSE）平均下降了19.2%~52.8%，平均绝对误差（MAE）平均下降了12.1%~33.8%。通过消融实验验证了所提出的多尺度分解模块、多头门控膨胀卷积以及时间注意力模块能提升时序预测的准确度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

18. 基于多路层次化混合专家模型的轴承故障诊断方法

徐欣然, 张绍兵, 成苗, 张洋, 曾尚

《计算机应用》唯一官方网站 2025, 45 (1): 59-68. DOI: 10.11772/j.issn.1001-9081.2024010043

摘要（153）

HTML （13）

PDF （3277KB）（1243）

针对滚动轴承故障诊断中处理复杂工况准确率较低的问题，提出一个多任务学习（MTL）模型，即多路层次化混合专家（MHMoE）模型，以及对应的层次化训练模式。该模型结合多阶段、多任务联合训练，实现了层次化的信息共享模式，并在普通MTL模式的基础上进一步提升了模型的泛化性和故障识别准确率，使模型能同时在复杂与简单的数据集上出色地完成任务，同时，结合一维ResNet的瓶颈层结构，在保证网络深度的同时，也规避梯度爆炸与梯度消失等问题，从而能充分地提取数据集的相关特征。以帕德博恩大学轴承故障数据集（PU）为测试数据集设计的实验的结果表明，在不同工况复杂度下，与不使用MTL的单任务混合专家单元结构（OMoE）-ResNet18模型相比，所提模型的准确率提升5.45~9.30个百分点；而与集成经验模态分解的Hilbert谱变换方法（EEMD-Hilbert）、MMoE （Multi-gate Mixture-of-Experts）和多尺度多任务注意力卷积神经网络（MSTACNN）等模型相比，所提模型的准确率至少提升3.21~16.45个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

19. 面向联邦学习的随机验证区块链构建

陈廷伟, 张嘉诚, 王俊陆

《计算机应用》唯一官方网站 2024, 44 (9): 2770-2776. DOI: 10.11772/j.issn.1001-9081.2023091254

摘要（262）

HTML （6）

PDF （1975KB）（1237）

针对现有联邦学习模型中存在的本地设备模型梯度泄露、中心化服务器设备可随意退出、全局模型无法抵御恶意用户攻击等问题，提出面向联邦学习的随机验证区块链构建及隐私保护方法。首先，引入可验证哈希函数以随机选举区块链的领导节点，确保节点出块的公平性；其次，设计了验证节点的交叉检测机制防御恶意节点的攻击；最后，基于差分隐私技术训练区块链节点，根据节点对模型的贡献程度构建激励规则进行节点激励，提高联邦学习模型的训练准确率。实验结果表明，所提方法在20%恶意节点的情况下，对于恶意节点的投毒攻击能够达到80%的准确率，相较于Google FL提升了61个百分点，而所提方法在噪声方差为10^-3时梯度匹配损失比Google FL提升了14个百分点。可见，相较于Google FL等联邦学习方法，所提方法在提升模型的安全性前提下能够保证良好的精确度，具有更好的安全性和鲁棒性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

20. 物联网应用中的可解释人工智能研究综述

赵小阳许新征李仲年

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2024070927
预出版日期: 2024-11-19

Select

21. 基于自注意力融合的不完整多视图聚类算法

李顺勇, 李师毅, 胥瑞, 赵兴旺

《计算机应用》唯一官方网站 2024, 44 (9): 2696-2703. DOI: 10.11772/j.issn.1001-9081.2023091253

摘要（341）

HTML （9）

PDF （2806KB）（1187）

基于不完整数据的多视图聚类任务已经成为无监督学习领域的研究热点之一。然而大多数基于“浅层”模型的多视图聚类算法通常在面对大规模高维数据时难以提取和刻画视图内的潜在特征结构；同时，堆叠或求平均的多视图信息融合方式忽视了视图之间的差异性，没有充分考虑各视图对构建公共一致表示的不同贡献。针对以上问题，提出一种基于自注意力融合的不完整多视图聚类算法（IMVCSAF）。首先，基于深度自编码器提取各视图的潜在特征，并采用对比学习的方式最大化各视图间的一致性信息；其次，采用自注意力机制对各视图的潜在表示进行重新编码和融合，并全面考虑和挖掘不同视图之间的内在因果性和特征互补性；再次，基于公共一致表示对缺失实例样本的潜在表示进行预测和恢复，从而完整地实现多视图聚类的过程。在Scene-15、LandUse-21、Caltech101-20和Noisy-MNIST数据集上的实验结果表明，IMVCSAF在满足收敛性要求的前提下得到的准确率均高于其他对比算法，而在50%缺失率的Noisy-MNIST数据集上，IMVCSAF的准确率比次优的COMPLETER（inCOMPlete muLti-view clustEring via conTrastivE pRediction）算法提高了6.58个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

22. 基于改进鲸鱼优化算法的动态无人机路径规划

王兴旺, 张清杨, 姜守勇, 董永权

《计算机应用》唯一官方网站 2025, 45 (3): 928-936. DOI: 10.11772/j.issn.1001-9081.2024030370

摘要（174）

HTML （5）

PDF （7205KB）（1162）

针对复杂地形环境下的无人机（UAV）路径规划问题，提出一种基于改进鲸鱼优化算法（MWOA）的动态UAV路径规划方法。首先，通过解析山体地形、动态目标和威胁区，建立三维动态环境与UAV航路模型；其次，提出一种自适应步长高斯游走策略，并将该策略用于平衡算法的全局探索与局部发掘的能力；最后，提出一种辅助修正策略对种群最优个体进行修正，并结合差分进化策略，在避免种群陷入局部最优的同时提高算法的收敛精度。为验证MWOA的有效性，使用MWOA与鲸鱼优化算法（WOA）、人工蜂鸟算法（AHA）等智能算法求解CEC2022测试函数，并在设计的UAV动态环境模型中进行验证。仿真结果对比分析表明，与WOA相比，MWOA的收敛精度提高了6.1%，标准差减小了44.7%。可见，所提MWOA收敛更快且精度更高，能有效处理UAV路径规划问题。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

23. 面向隐私计算的可信执行环境综述

张涵, 于航, 周继威, 白云开, 赵路坦

《计算机应用》唯一官方网站 2025, 45 (2): 467-481. DOI: 10.11772/j.issn.1001-9081.2024020222

摘要（136）

HTML （9）

PDF （1430KB）（1146）

随着云计算和大数据的普及，越来越多的用户隐私数据被上传到云端计算和处理；然而，由于隐私数据交由不可信的第三方存储和管理，因此面临被泄露的风险，进而导致公民的生命和财产安全乃至国家的安全都受到不利影响。近年来，一些基于密码学算法的隐私计算技术，例如安全多方计算、同态加密（HE）和联邦学习等，解决了隐私数据传输和计算过程中的安全问题，进而实现了隐私数据的“可用不可见”；然而，这些方案由于计算和通信复杂度的原因没能得到广泛部署和应用。许多研究工作致力于利用可信执行环境（TEE）降低隐私计算技术的计算量和通信复杂度，同时保证不影响这些技术的安全性。TEE通过硬件辅助创建可以信赖的执行环境，并保证其中隐私数据和代码的机密性、完整性和可用性。因此，从隐私计算和TEE结合的研究入手。首先，全面分析TEE保护用户隐私数据的系统架构和硬件支持；其次，对比现有TEE架构各自的优势和不足；最后，结合工业界和学术界的最新进展，探讨隐私计算和TEE交叉研究领域的未来发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

24. 面向学生课堂情感计算的自适应混合网络

戎妍, 刘嘉雯, 李馨蕾

《计算机应用》唯一官方网站 2024, 44 (9): 2919-2930. DOI: 10.11772/j.issn.1001-9081.2023091303

摘要（302）

HTML （5）

PDF （4730KB）（1126）

情感计算可以为智慧教育提供更好的教学效果和学习体验。目前针对课堂领域的情感计算研究仍存在有限的适应性与对复杂场景的感知能力较弱的问题。针对这一挑战，提出一种混合架构SC-ACNet，旨在对学生课堂进行准确的情感计算。该架构包含一个能适应小目标的多尺度学生面部检测模块；一个能适应不同面部姿态的、具有自适应空间结构的情感计算模块，对学生的5种课堂情感（平静、困惑、愉悦、困倦和惊讶）进行准确识别；以及一个自注意力模块，以可视化模型中对结果产生主要贡献的区域。此外，为缓解课堂环境下学生面部情绪图像数据集匮乏的问题，构建了一个学生课堂数据集SC-ACD。在SC-ACD数据集上的实验结果表明，与基线方法YOLOv7相比，SC-ACNet的平均精度均值（mAP）提升了4.2个百分点，情感计算准确率提升了9.1个百分点；此外，SC-ACNet在KDEF和RaFD数据集上的准确率分别达到了0.972和0.994，验证了SC-ACNet可作为提高智慧课堂教学质量的有前途的解决方案。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

25. 面向手术导航3D/2D配准的无监督跨域迁移网络

王熙源, 张战成, 徐少康, 张宝成, 罗晓清, 胡伏原

《计算机应用》唯一官方网站 2024, 44 (9): 2911-2918. DOI: 10.11772/j.issn.1001-9081.2023091332

摘要（346）

HTML （3）

PDF （2025KB）（1123）

3D/2D配准是手术导航的关键技术，现有基于深度学习的配准方法通过网络提取图像特征，继而回归出相应的姿态变换参数。此类方法依赖于真实的样本以及对应的3D标签用于训练，然而这部分专家标注的医疗数据十分稀缺。替代的方案用数字重建放射影像（DRR）图像训练网络，由于图像特征跨域的差异，在X射线图像上难以保持原有的配准精度。针对上述问题，设计基于自注意力的无监督跨域迁移网络（UCDTN），无须依赖X射线图像与其对应的3D空间标签作为训练样本，将源域所捕获的图像特征与空间变换间的对应关系迁移到目标域，借助公共特征减小域间特征的差距、降低跨域所带来的负面影响。实验结果表明，UCDTN预测结果的平均配准误差（mTRE）为2.66 mm；与未经跨域迁移训练的模型相比，mTRE指标降低了70.61%，验证了UCDTN在跨域配准任务上的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

26. Wi-Fi7多链路通感一体化的功率和信道联合智能分配算法

王靖, 方旭明

《计算机应用》唯一官方网站 2025, 45 (2): 563-570. DOI: 10.11772/j.issn.1001-9081.2024020191

摘要（113）

HTML （0）

PDF （2623KB）（1121）

针对下一代Wi-Fi7设备中多链路传输时通信与感知一体化的功率和信道联合资源分配的问题，根据多链路设备（MLD）特殊的上下两层媒体接入控制层（MAC）结构，提出一种基于QMIX的联合功率控制与信道分配的多链路多智能体强化学习算法（JPCQMIX）。该算法将MLD的每个下层MAC即每条链路作为一个智能体，并在上层MAC中设置混合网络用来处理所有下层MAC的局部值函数，以达到中心式训练的效果。训练完成后，每个下层MAC进入分布式执行模式，并独立地与它的局部环境进行交互，以进行功率控制和信道分配决策。仿真结果表明，相较于多智能体深度Q网络（MADQN）算法和传统启发式粒子群优化（PSO）算法，所提算法在通信吞吐量性能上分别提高了20.51%和29.10%；同时，所提算法在面对不同感知精度阈值和不同链路最低信干噪比（SINR）时，鲁棒性更好。可见，JPCQMIX能有效提升系统在满足感知精度条件下的通信吞吐量。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

27. 基于语义增强模式链接的Text-to-SQL模型

吴相岚, 肖洋, 刘梦莹, 刘明铭

《计算机应用》唯一官方网站 2024, 44 (9): 2689-2695. DOI: 10.11772/j.issn.1001-9081.2023091360

摘要（286）

HTML （25）

PDF （739KB）（1119）

为优化基于异构图编码器的Text-to-SQL生成效果，提出SELSQL模型。首先，模型采用端到端的学习框架，使用双曲空间下的庞加莱距离度量替代欧氏距离度量，以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图；其次，利用K头加权的余弦相似度以及图正则化方法学习相似度度量图使得初始模式链接图在训练中迭代优化；最后，使用改良的关系图注意力网络（RGAT）图编码器以及多头注意力机制对两个模块的联合语义模式链接图进行编码，并且使用基于语法的神经语义解码器和预定义的结构化语言进行结构化查询语言（SQL）语句解码。在Spider数据集上的实验结果表明，使用ELECTRA-large预训练模型时，SELSQL模型比最佳基线模型的准确率提升了2.5个百分点，对于复杂SQL语句生成的提升效果很大。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

28. 基于裁剪近端策略优化算法的软机械臂不规则物体抓取

余家宸, 杨晔

《计算机应用》唯一官方网站 2024, 44 (11): 3629-3638. DOI: 10.11772/j.issn.1001-9081.2023111712

摘要（203）

HTML （2）

PDF （3923KB）（1103）

PDF（mobile）（1849KB）（18）

为应对传统深度强化学习（DRL）算法在处理复杂场景，特别是在不规则物体抓取和软体机械臂应用中算法稳定性和学习率较差的问题，提出一种基于裁剪近端策略优化（CPPO）算法的软体机械臂控制策略。通过引入裁剪函数，该算法优化了近端策略优化（PPO）算法的性能，提升了它在高维状态空间的稳定性和学习效率。首先定义了软体机械臂的状态空间和动作空间，并设计了模仿八爪鱼触手的软体机械臂模型；其次利用Matlab的SoRoSim （Soft Robot Simulation）工具箱进行建模，同时定义了结合连续和稀疏函数的环境奖励函数；最后构建了基于Matlab的仿真平台，通过Python脚本和滤波器对不规则物体图像进行预处理，并利用Redis缓存高效传输处理后的轮廓数据至仿真平台。与TRPO （Trust Region Policy Optimization）和SAC （Soft Actor-Critic）算法的对比实验结果表明，CPPO算法在软体机械臂抓取不规则物体任务中达到了86.3%的成功率，比TRPO算法高出了3.6个百分点。这说明CPPO算法可以应用于软体机械臂控制，可在非结构化环境下为软体机械臂在复杂抓取任务中的应用提供重要参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

29. 融合多尺度语义和双分支并行的医学图像分割网络

袁宝华, 陈佳璐, 王欢

《计算机应用》唯一官方网站 2025, 45 (3): 988-995. DOI: 10.11772/j.issn.1001-9081.2024030358

摘要（127）

HTML （1）

PDF （2085KB）（1074）

在医学图像分割网络中，卷积神经网络（CNN）虽然能提取丰富的局部特征细节，但存在远程信息捕获不足的问题。Transformer虽然可以捕捉长距离的全局特征依赖关系，但是会破坏局部特征细节。为充分利用2种网络特征的互补性，提出一种用于医学图像分割的CNN和Transformer并行的融合网络——PFNet。该网络的并行融合模块使用一对基于CNN和Transformer的相互依赖的并行分支来高效地学习局部和全局两方面的辨别特征，并以交互方式交叉融合局部特征和长距离特征的依赖关系；同时，为恢复在下采样期间丢失的空间信息以增强细节的保留，提出多尺度交互（MSI）模块提取分层CNN分支生成的多尺度特征的局部上下文以进行远程依赖关系建模。实验结果表明，PFNet优于MISSFormer（Medical Image Segmentation tranSFormer）和UCTransNet（U-Net with Channel Transformer module）等先进方法。在Synapse和ACDC（Automated Cardiac Diagnosis Challenge）数据集上，相较于最优的基线方法MISSFormer，PFNet的平均Dice相似系数（DSC）分别提高1.27%和0.81%。可见，PFNet能实现更精准的医学图像分割。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

30. 基于自适应差分隐私与客户选择优化的联邦学习方法

徐超, 张淑芬, 陈海田, 彭璐璐, 张帅华

《计算机应用》唯一官方网站 2025, 45 (2): 482-489. DOI: 10.11772/j.issn.1001-9081.2024020162

摘要（179）

HTML （2）

PDF （2308KB）（1045）

将差分隐私应用于联邦学习的方法是保护训练数据隐私的关键技术之一。针对之前多数工作未考虑参数的异质性，对训练参数均匀裁剪使每轮加入的噪声都是均匀的，从而影响模型收敛和训练参数质量的问题，提出一种基于梯度裁剪的自适应噪声添加方案。考虑梯度的异质性，在不同轮次为不同客户端执行自适应的梯度裁剪，从而使噪声大小自适应调整；同时，为进一步提升模型性能，对比传统的客户端随机采样方式，提出一种结合轮盘赌与精英保留的客户端采样方法。结合上述2种方法，提出一种结合客户端选择的自适应差分隐私联邦学习（CS&AGC DP_FL）方法。实验结果表明，在隐私预算为0.5时，相较于自适应差分隐私的联邦学习方法（Adapt DP_FL），所提方法能在相同级别的隐私约束下使最终的模型分类准确率提升4.9个百分点，并且在收敛速度方面，所提方法相较于对比方法进入收敛状态所需的轮次减少了4~10轮。

图表 | 参考文献 | 相关文章 | 多维度评价

全文下载排行