《计算机应用》唯一官方网站

Select

1. 基于改进YOLOv8的嵌入式道路裂缝检测算法

耿焕同, 刘振宇, 蒋骏, 范子辰, 李嘉兴

《计算机应用》唯一官方网站 2024, 44 (5): 1613-1618. DOI: 10.11772/j.issn.1001-9081.2023050635

摘要（1932）

HTML （76）

PDF （2002KB）（3024）

在边缘端设备部署YOLOv8L模型进行道路裂缝检测可以实现较高的精度，但难以保证实时检测。针对此问题，提出一种可部署到边缘计算设备Jetson AGX Xavier上的基于改进YOLOv8模型的目标检测算法。首先，利用部分卷积设计Faster Block结构以替换YOLOv8 C2f模块中的Bottleneck结构，并将改进后的C2f模块记为C2f-Faster；其次，在YOLOv8主干网络中的每个C2f-Faster模块之后接一个SE（Squeeze-and-Excitation）通道注意力层，进一步提高检测的精度。在开源道路损害数据集RDD20（Road Damage Detection 20）上的实验结果表明：所提方法的平均F1得分为0.573，每秒检测帧数（FPS）为47，模型大小为55.5 MB，相较于GRDDC2020 （Global Road Damage Detection Challenge 2020）的SOTA（State-Of-The-Art）模型，F1得分提高了0.8个百分点，FPS提高了291.7%，模型大小减小了41.8%，实现了在边缘设备上对道路裂缝实时且准确的检测。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 大语言模型的技术应用前景与风险挑战

徐月梅, 胡玲, 赵佳艺, 杜宛泽, 王文清

《计算机应用》唯一官方网站 2024, 44 (6): 1655-1662. DOI: 10.11772/j.issn.1001-9081.2023060885

摘要（1413）

HTML （107）

PDF （1142KB）（2360）

针对大语言模型（LLM）技术的快速发展，剖析它的技术应用前景和风险挑战，对通用人工智能（AGI）的发展和治理有重要参考价值。首先，以Multi-BERT（Multilingual Bidirectional Encoder Representations from Transformers）、GPT（Generative Pre-trained Transformer）和ChatGPT（Chat Generative Pre-Trained Transformer）等语言模型为代表，综述LLM的发展脉络、核心技术和评估体系；其次，分析LLM现存的技术局限和安全风险；最后，提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM，现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺，算力需求庞大，对数据质量和数量依赖性强，语言风格单一；存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进，从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”；从政策上实时跟进，实施有针对性的监管措施，规范应用和发展。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 多模态知识图谱表示学习综述

王春雷, 王肖, 刘凯

《计算机应用》唯一官方网站 2024, 44 (1): 1-15. DOI: 10.11772/j.issn.1001-9081.2023050583

摘要（1407）

HTML （118）

PDF （3449KB）（6385）

在综合对比传统知识图谱表示学习模型优缺点以及适用任务后，发现传统的单一模态知识图谱无法很好地表示知识。因此，如何利用文本、图片、视频、音频等多模态数据进行知识图谱表示学习成为一个重要的研究方向。同时，详细分析了常用的多模态知识图谱数据集，为相关研究人员提供数据支持。在此基础上，进一步讨论了文本、图片、视频、音频等多模态融合下的知识图谱表示学习模型，并对其中各种模型进行了总结和比较。最后，总结了多模态知识图谱表示学习如何改善经典应用，包括知识图谱补全、问答系统、多模态生成和推荐系统在实际应用中的效果，并对未来的研究工作进行了展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. YOLO算法及其在自动驾驶场景中目标检测综述

邓亚平, 李迎江

《计算机应用》唯一官方网站 2024, 44 (6): 1949-1958. DOI: 10.11772/j.issn.1001-9081.2023060889

摘要（1382）

HTML （42）

PDF （1175KB）（906）

自动驾驶场景下的目标检测是计算机视觉中重要研究方向之一，确保自动驾驶汽车对物体进行实时准确的目标检测是研究重点。近年来，深度学习技术迅速发展并被广泛应用于自动驾驶领域中，极大促进了自动驾驶领域的进步。为此，针对YOLO（You Only Look Once）算法在自动驾驶领域中的目标检测研究现状，从以下4个方面分析。首先，总结单阶段YOLO系列检测算法思想及其改进方法，分析YOLO系列算法的优缺点；其次，论述YOLO算法在自动驾驶场景下目标检测中的应用，从交通车辆、行人和交通信号识别这3个方面分别阐述和总结研究现状及应用情况；此外，总结目标检测中常用的评价指标、目标检测数据集和自动驾驶场景数据集；最后，展望目标检测存在的问题和未来发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 大语言模型综述与展望

秦小林, 古徐, 李弟诚, 徐海文

《计算机应用》唯一官方网站 2025, 45 (3): 685-696. DOI: 10.11772/j.issn.1001-9081.2025010128

摘要（933）

HTML （81）

PDF （2035KB）（1858）

大语言模型（LLM）是由具有大量参数（通常数十亿个权重或更多）的人工神经网络组成的一类语言模型，使用自监督学习或半监督学习对大量未标记文本进行训练，是当前生成式人工智能（AI）技术的核心。与传统语言模型相比，LLM通过大量的算力、参数和数据支持，展现出更强的语言理解与生成能力，广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法，对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此，在介绍LLM的基础架构、训练技术及发展历程的基础上，分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究，进一步阐述LLM在实际应用中面临的挑战，包括数据偏差、模型幻觉和计算资源消耗等问题，并对LLM的持续发展趋势进行展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 运动想象脑电信号的跨被试动态多域对抗学习方法

曹铉, 罗天健

《计算机应用》唯一官方网站 2024, 44 (2): 645-653. DOI: 10.11772/j.issn.1001-9081.2023030286

摘要（903）

HTML （16）

PDF （3364KB）（247）

解码运动想象脑电（EEG）信号是构造脑机接口（BCI）的关键技术之一。然而，脑电样本采集成本高、个体差异大，且信号具有时变性强、低信噪比等特点，构建跨被试模式识别方法成为了研究的关键。为此，提出一种跨被试动态多域对抗学习方法。首先采用样本协方差对齐和全局域鉴别器适应样本集边缘分布，随后采用多个类别子域鉴别器适应样本集条件分布，并自适应学习多域鉴别器的对抗系数。基于动态多域对抗学习策略，所提出的动态多域对抗网络（DMDAN）模型可学习到被试域间有泛化能力的深度特征。在BCI Competition IV 2A和2B公开数据集上的实验结果表明，DMDAN模型提高了跨被试域不变特征的学习能力，与现有对抗学习方法DRDA（Deep Representation Domain Adaptation）相比，在数据集2A和数据集2B上的平均分类准确率分别提高了1.80和2.52个百分点。可见，所提出的DMDAN模型提升了跨被试运动想象脑电信号解码性能，在不同数据集上具有不错的泛化性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 卷积神经网络中基于差分隐私的动量梯度下降算法

张宇, 蔡英, 崔剑阳, 张猛, 范艳芳

《计算机应用》唯一官方网站 2023, 43 (12): 3647-3653. DOI: 10.11772/j.issn.1001-9081.2022121881

摘要（871）

HTML （129）

PDF （1985KB）（724）

针对卷积神经网络（CNN）模型的训练过程中，模型参数记忆数据部分特征导致的隐私泄露问题，提出一种CNN中基于差分隐私的动量梯度下降算法（DPGDM）。首先，在模型优化的反向传播过程中对梯度添加满足差分隐私的高斯噪声，并用加噪后的梯度值参与模型参数的更新过程，从而实现对模型整体的差分隐私保护；其次，为了减少引入差分隐私噪声对模型收敛速度的影响，设计学习率衰减策略，改进动量梯度下降算法；最后，为了降低噪声对模型准确率的影响，在模型优化过程中动态地调整噪声尺度的值，从而改变在每一轮迭代中需要对梯度加入的噪声量。实验结果表明，与DP-SGD （Differentially Private Stochastic Gradient Descent）相比，所提算法可以在隐私预算为0.3和0.5时，模型准确率分别提高约5和4个百分点。可见，所提算法提高了模型的可用性，并实现了对模型的隐私保护。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

8. 基于生成对抗网络的联邦学习中投毒攻击检测方案

陈谦, 柴政, 王子龙, 陈嘉伟

《计算机应用》唯一官方网站 2023, 43 (12): 3790-3798. DOI: 10.11772/j.issn.1001-9081.2022121831

摘要（834）

HTML （43）

PDF （2367KB）（1361）

联邦学习（FL）是一种新兴的隐私保护机器学习（ML）范式，然而它的分布式的训练结构更易受到投毒攻击的威胁：攻击者通过向中央服务器上传投毒模型以污染全局模型，减缓全局模型收敛并降低全局模型精确度。针对上述问题，提出一种基于生成对抗网络（GAN）的投毒攻击检测方案。首先，将良性本地模型输入GAN产生检测样本；其次，使用生成的检测样本检测客户端上传的本地模型；最后，根据检测指标剔除投毒模型。同时，所提方案定义了F1值损失和精确度损失这两项检测指标检测投毒模型，将检测范围从单一类型的投毒攻击扩展至全部两种类型的投毒攻击；设计阈值判定方法处理误判问题，确保误判鲁棒性。实验结果表明，在MNIST和Fashion-MNIST数据集上，所提方案能够生成高质量检测样本，并有效检测与剔除投毒模型；与使用收集测试数据和使用生成测试数据但仅使用精确度作为检测指标的两种检测方案相比，所提方案的全局模型精确度提升了2.7~12.2个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

9. 基于网络结构设计的图神经网络特征选择方法

徐大鹏, 侯新民

《计算机应用》唯一官方网站 2024, 44 (3): 663-670. DOI: 10.11772/j.issn.1001-9081.2023030353

摘要（802）

HTML （125）

PDF （1001KB）（1354）

近年来，研究人员针对图神经网络（GNN）提出了许多改进的模型架构设计，推动了各种预测任务的性能提升。但大多数GNN变体在开始都认为节点的特征同等重要，而实际情况并非如此。针对这个问题，提出一种特征选择方法来改进现有模型，并为数据集选择出重要特征子集。所提方法由特征选择层和标签-特征单独映射两个组件构成。在特征选择层中使用Softmax归一化器和特征“软选择器”进行特征选择，在标签-特征单独映射思想下设计模型结构，为不同的标签选择对应的相关特征子集，并将多个相关特征子集作集合并运算得到最终数据集的重要特征子集。选取图注意力网络（GAT）和GATv2模型为基准模型，将算法应用到基准模型中得到新模型。实验结果表明，所提模型在6个数据集上执行节点分类任务时，准确率相较于基准模型提升了0.83%~8.79%；新模型也为6个数据集选择了对应的重要特征子集，这些重要特征子集的特征数量占各自数据集总特征数的3.94%~12.86%，将重要特征子集作为基准模型的新输入后仍然获得了95%以上的准确率（使用了所有特征），即在保证准确率的基础上减小了模型的规模。可见，所提方法能够提高节点分类准确率，并有效地为数据集选择对应的重要特征子集。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

10. 不完整多视图聚类综述

董瑶, 付怡雪, 董永峰, 史进, 陈晨

《计算机应用》唯一官方网站 2024, 44 (6): 1673-1682. DOI: 10.11772/j.issn.1001-9081.2023060813

摘要（762）

HTML （19）

PDF （2050KB）（945）

多视图聚类是近年来图数据挖掘领域的研究热点。由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此，综合研究不完整多视图聚类（IMC）近年的发展具有重要的理论意义和实践价值。首先，归纳分析不完整多视图数据缺失类型；其次，详细比较基于多核学习（MKL）、矩阵分解（MF）学习、深度学习和图学习这4类IMC方法，分析代表性方法的技术特点和区别；再次，从数据集类型、视图和类别数量、应用领域等角度总结22个公开不完整多视图数据集；继次，总结评价指标，并系统分析现有不完整多视图聚类方法在同构和异构数据集上的性能表现；最后，归纳分析不完整多视图聚类目前存在的问题、未来的发展方向和现有应用领域。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

11. 基于Transformer-CNN的轻量级图像超分辨率重建网络

陈豪, 夏振平, 程成, 林李兴, 张博文

《计算机应用》唯一官方网站 2024, 44 (1): 292-299. DOI: 10.11772/j.issn.1001-9081.2023010048

摘要（743）

HTML （26）

PDF （1855KB）（412）

针对现有超分辨率重建网络具有较高的计算复杂度和存在大量内存消耗的问题，提出了一种基于Transformer-CNN的轻量级图像超分辨率重建网络，使超分辨率重建网络更适合应用于移动平台等嵌入式终端。首先，提出了一个基于Transformer-CNN的混合模块，从而增强网络捕获局部-全局深度特征的能力；其次，提出了一个改进的倒置残差块来特别关注高频区域的特征，以提升特征提取能力和减少推理时间；最后，在探索激活函数的最佳选择后，采用GELU （Gaussian Error Linear Unit）激活函数来进一步提高网络性能。实验结果表明，所提网络可以在图像超分辨率性能和网络复杂度之间取得很好的平衡，而且在基准数据集Urban100上4倍超分辨率的推理速度达到91 frame/s，比优秀网络SwinIR （Image Restoration using Swin transformer）快11倍，表明所提网络能够高效地重建图像的纹理和细节，并减少大量的推理时间。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

12. 超图应用方法综述：问题、进展与挑战

曾蠡, 杨婧如, 黄罡, 景翔, 罗超然

《计算机应用》唯一官方网站 2024, 44 (11): 3315-3326. DOI: 10.11772/j.issn.1001-9081.2023111629

摘要（732）

HTML （25）

PDF （795KB）（462）

超图是图的泛化，相较于普通图，它在复杂关系的高阶特征表达上具有显著优势。作为一种相对较新的数据结构，超图在应用领域正在发挥越来越大的作用，研究者采用超图模型及算法对现实世界中的具体问题进行建模、求解，有效地提升了解决问题的效率及质量。现有对超图的综述更多侧重于解决超图本身问题的理论及技术，缺乏对超图在具体应用场景下的建模及求解方法的归纳总结。为此，在总结介绍超图的一些基础概念后，分析了超图在各个主流应用场景下的应用方法、技术、共性问题及解决方案；通过对现有工作的归纳总结，阐述了超图运用于现实问题中仍然存在的一些问题与障碍；最后，对超图应用的未来研究方向进行了展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

13. 联邦学习中的安全威胁与防御措施综述

陈学斌, 任志强, 张宏扬

《计算机应用》唯一官方网站 2024, 44 (6): 1663-1672. DOI: 10.11772/j.issn.1001-9081.2023060832

摘要（690）

HTML （22）

PDF （1072KB）（1311）

联邦学习是一种用于解决机器学习中数据共享问题和隐私保护问题的分布式学习方法，旨在多方共同训练一个机器学习模型并保护数据的隐私；但是，联邦学习本身存在安全威胁，这使得联邦学习在实际应用中面临巨大的挑战，因此，分析联邦学习面临的攻击和相应的防御措施对联邦学习的发展和应用至关重要。首先，介绍联邦学习的定义、流程和分类，联邦学习中的攻击者模型；其次，从联邦学习系统的鲁棒性和隐私性两方面介绍可能遭受的攻击，并介绍不同攻击相应的防御措施，同时也指出防御方案的不足；最后，展望安全的联邦学习系统。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

14. 基于Transformer的视觉目标跟踪方法综述

孙子文, 钱立志, 杨传栋, 高一博, 陆庆阳, 袁广林

《计算机应用》唯一官方网站 2024, 44 (5): 1644-1654. DOI: 10.11772/j.issn.1001-9081.2023060796

摘要（648）

HTML （22）

PDF （1615KB）（1632）

视觉目标跟踪是计算机视觉中的重要任务之一，为实现高性能的目标跟踪，近年来提出了大量的目标跟踪方法，其中基于Transformer的目标跟踪方法由于具有全局建模和联系上下文的能力，是目前视觉目标跟踪领域研究的热点。首先，根据网络结构的不同对基于Transformer的视觉目标跟踪方法进行分类，概述相关原理和模型改进的关键技术，总结不同网络结构的优缺点；其次，对这类方法在公开数据集上的实验结果进行对比，分析网络结构对性能的影响，其中MixViT-L（ConvMAE）在LaSOT和TrackingNet上跟踪成功率分别达到了73.3%和86.1%，说明基于纯Transformer两段式架构的目标跟踪方法具有更优的性能和更广的发展前景；最后，对方法当前存在的网络结构复杂、参数量大、训练要求高和边缘设备使用难度大等不足进行总结，并对今后的研究重点进行展望，通过与模型压缩、自监督学习以及Transformer可解释性分析相结合，可为基于Transformer的视觉目标跟踪提出更多可行的解决方案。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

15. 横向联邦学习中差分隐私聚类算法

徐雪冉, 杨庚, 黄喻先

《计算机应用》唯一官方网站 2024, 44 (1): 217-222. DOI: 10.11772/j.issn.1001-9081.2023010019

摘要（641）

HTML （16）

PDF （1418KB）（310）

聚类分析能够挖掘出数据间隐藏的内在联系并对数据进行多指标划分，从而促进个性化和精细化运营。然而，数据孤岛造成的数据碎片化和孤立化严重影响了聚类分析的应用效果。为了解决数据孤岛问题的同时保护相关数据隐私，提出本地均分扰动联邦K-means算法（ELFedKmeans）。针对横向联邦学习模式，设计了一种基于网格的初始簇心选择方法和一种隐私预算分配方案。在ELFedKmeans算法中，各站点联合协商随机种子，以较小的通信代价生成相同的随机噪声，保护了本地数据的隐私。通过理论分析证明了该算法满足差分隐私保护，并将该算法与本地差分隐私K-means（LDPKmeans）算法和混合型隐私保护K-means （HPKmeans）算法在不同的数据集上进行了对比实验分析。实验结果表明，随着隐私预算不断增大，三个算法的F-measure值均逐渐升高；误差平方和（SSE）均逐渐减小。从整体上看，ELFedKmeans算法的F-measure值比LDPKmeans算法和HPKmeans算法分别高了1.794 5%~57.066 3%和21.245 2%~132.048 8%；ELFedKmeans算法的Log（SSE）值比LDPKmeans算法和HPKmeans算法分别减少了1.204 2%~12.894 6%和5.617 5%~27.575 2%。在相同的隐私预算下，ELFedKmeans算法在聚类质量和可用性指标上优于对比算法。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

16. 知识图谱在装备故障诊断领域的研究与应用综述

武杰, 张安思, 吴茂东, 张仪宗, 王从宝

《计算机应用》唯一官方网站 2024, 44 (9): 2651-2659. DOI: 10.11772/j.issn.1001-9081.2023091280

摘要（634）

HTML （55）

PDF （2858KB）（2032）

知识图谱从装备故障诊断数据中提取有用的知识，通过（实体，关系，实体）的三元组方式，对复杂装备的故障诊断信息进行有效管理，实现装备故障的快速诊断。首先，介绍装备故障诊断知识图谱的相关概念，分析装备故障诊断领域知识图谱的构建框架；其次，归纳国内外装备故障诊断知识图谱的知识抽取、知识融合以及知识推理等几个关键技术的研究现状；最后，对目前装备故障诊断知识图谱应用进行总结，提出该领域知识图谱构建的不足和面临的挑战，并对未来装备故障诊断领域提供一些新的思路。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

17. 优化场景视角下的进化多任务优化综述

赵佳伟, 陈雪峰, 冯亮, 候亚庆, 朱泽轩, Yew‑Soon Ong

《计算机应用》唯一官方网站 2024, 44 (5): 1325-1337. DOI: 10.11772/j.issn.1001-9081.2024020208

摘要（624）

HTML （74）

PDF （1383KB）（2279）

随着优化问题变得日益复杂，传统的进化算法由于计算成本高昂和适用性有限而面临挑战。为了克服这些挑战，基于知识迁移的进化多任务优化（EMTO）算法应运而生，它的核心思想是通过跨任务的知识共享，同时解决多个优化问题，旨在提高进化算法在应对复杂优化场景的效率。全面总结了当前进化多任务优化研究的进展，与已有综述文章相比，从不同的研究视角进行深入探讨，并指出了现有文献中对优化场景视角分析的缺失。鉴于此，从优化问题的应用场景出发，对适用于进化多任务优化的场景及其基本解决策略进行了系统性的阐述，以帮助研究人员准确地根据具体应用需求选择合适的研究方法。此外，深入讨论进化多任务优化当前面临的挑战和未来的研究方向，旨在为未来的研究提供指导和启示。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

18. 深度神经网络平均场理论综述

颜梦玫, 杨冬平

《计算机应用》唯一官方网站 2024, 44 (2): 331-343. DOI: 10.11772/j.issn.1001-9081.2023020166

摘要（618）

HTML （59）

PDF （1848KB）（2425）

平均场理论（MFT）为理解深度神经网络（DNN）的运行机制提供了非常深刻的见解，可以从理论上指导深度学习的工程设计。近年来，越来越多的研究人员开始投入DNN的理论研究，特别是基于MFT的一系列工作引起人们的广泛关注。为此，对深度神经网络平均场理论相关的研究内容进行综述，主要从初始化、训练过程和泛化性能这三个基本方面介绍最新的理论研究成果。在此基础上，介绍了混沌边缘和动力等距初始化的相关概念、相关特性和具体应用，分析了过参数网络以及相关等价网络的训练特性，并对不同网络架构的泛化性能进行理论分析，体现了平均场理论是理解深度神经网络机理的非常重要的基本理论方法。最后，总结了深度神经网络中初始、训练和泛化阶段的平均场理论面临的主要挑战和未来研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

19. 融合多Prompt模板的零样本关系抽取模型

许亮, 张春, 张宁, 田雪涛

《计算机应用》唯一官方网站 2023, 43 (12): 3668-3675. DOI: 10.11772/j.issn.1001-9081.2022121869

摘要（615）

HTML （42）

PDF （1768KB）（935）

Prompt范式被广泛应用于零样本的自然语言处理（NLP）任务中，但是现有基于Prompt范式的零样本关系抽取（RE）模型存在答案空间映射难构造与模板选择依赖人工的问题，无法取得较好的效果。针对这些问题，提出一种融合多Prompt模板的零样本RE模型。首先，将零样本RE任务定义为掩码语言模型（MLM）任务，舍弃答案空间映射的构造，将模板输出的词与关系描述文本在词向量空间中进行比较，以此判断关系类别；其次，引入待抽取关系类别的描述文本的词性作为特征，学习该特征与各个模板之间的权重；最后，利用该权重融合多个模板输出的结果，以此减少人工选取的Prompt模板引起的性能损失。在FewRel（Few-shot Relation extraction dataset）和TACRED（Text Analysis Conference Relation Extraction Dataset）这两个数据集上的实验结果显示，与目前最优的模型RelationPrompt相比，所提模型在不同数据资源设置下，F1值分别提升了1.48~19.84个百分点和15.27~15.75个百分点。可见，所提模型在零样本RE任务上取得了显著的效果提升。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

20. 区块链3.0的发展、技术与应用

方鹏, 赵凡, 王保全, 王轶, 蒋同海

《计算机应用》唯一官方网站 2024, 44 (12): 3647-3657. DOI: 10.11772/j.issn.1001-9081.2023121826

摘要（602）

HTML （42）

PDF （2294KB）（373）

区块链3.0是区块链技术发展的第3阶段，也是构建价值互联网的内核，它在分片、跨链以及隐私保护等方面的创新使它具有广泛的应用场景和研究价值，受到学术界和产业界相关人士的高度重视。针对区块链3.0的发展、技术与应用，调研并综述近5年国内外关于区块链3.0的相关文献。首先，介绍区块链的基本理论和技术特点，为深入了解区块链的研究进展奠定基础；其次，根据区块链技术随时间变化的演进趋势，阐述区块链3.0的发展历程和各个关键的发展时间节点，并给出以分片和侧链技术为基准点划分区块链不同的发展阶段的理由；再次，详细分析区块链3.0关键技术的研究现状，概述归纳它在物联网、医疗和农业等6大领域内的典型应用；最后，总结区块链3.0在发展过程中面临的关键性挑战和未来发展机遇。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

21. 基于语音和文本的双模态情感识别综述

韩令敏, 陈仙红, 熊文梦

《计算机应用》唯一官方网站 2025, 45 (4): 1025-1034. DOI: 10.11772/j.issn.1001-9081.2024030319

摘要（600）

HTML （66）

PDF （1625KB）（1791）

情感识别是一种让计算机识别和理解人类情感的技术，在众多领域都起着重要的作用，也是人工智能领域重要的发展方向。因此，梳理与归纳基于语音和文本的双模态情感识别的研究现状：首先，分类阐述情感表示空间；其次，按照情感数据库的情感表示空间对这些数据库进行分类，并总结常见的多模态情感数据库；再次，介绍基于语音和文本的双模态情感识别方法，包括特征提取、模态融合和决策分类，重点介绍模态融合方法并将这些方法分为特征级融合、决策级融合、模型级融合和多层次融合这4类；此外，比较和分析一系列语音和文本双模态情感识别方法的结果；最后，介绍情感识别的应用场景、面临的挑战与未来的发展方向。以上旨在对多模态情感识别，尤其是对基于语音和文本的双模态情感识别的相关工作进行分析与总结，并为情感识别提供有价值的参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

22. 基于路径模仿和SAC强化学习的机械臂路径规划算法

宋紫阳, 李军怀, 王怀军, 苏鑫, 于蕾

《计算机应用》唯一官方网站 2024, 44 (2): 439-444. DOI: 10.11772/j.issn.1001-9081.2023020132

摘要（591）

HTML （18）

PDF （2673KB）（432）

在机械臂路径规划算法的训练过程中，由于动作空间和状态空间巨大导致奖励稀疏，机械臂路径规划训练效率低，面对海量的状态数和动作数较难评估状态价值和动作价值。针对上述问题，提出一种基于SAC（Soft Actor-Critic）强化学习的机械臂路径规划算法。通过将示教路径融入奖励函数使机械臂在强化学习过程中对示教路径进行模仿以提高学习效率，并采用SAC算法使机械臂路径规划算法的训练更快、稳定性更好。基于所提算法和深度确定性策略梯度（DDPG）算法分别规划10条路径，所提算法和DDPG算法规划的路径与参考路径的平均距离分别是0.8 cm和1.9 cm。实验结果表明，路径模仿机制能提高训练效率，所提算法比DDPG算法能更好地探索环境，使得规划路径更加合理。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

23. 基于改进BERT的电力领域中文分词方法

夏飞, 陈帅琦, 华珉, 蒋碧鸿

《计算机应用》唯一官方网站 2023, 43 (12): 3711-3718. DOI: 10.11772/j.issn.1001-9081.2022121897

摘要（586）

HTML （20）

PDF （1953KB）（241）

针对电力领域中文文本包含大量专有词时分词效果不佳的问题，提出一种基于改进BERT （Bidirectional Encoder Representation from Transformers）的电力领域中文分词（CWS）方法。首先，构建分别涵盖通用、领域词的词典，并设计双词典匹配融合机制将词特征直接融入BERT模型，使模型更有效地利用外部知识；其次，通过引入DEEPNORM方法提高模型对于特征的提取能力，并使用贝叶斯信息准则（BIC）确定模型的最佳深度，使BERT模型稳定加深至40层；最后，采用ProbSparse自注意力机制层替换BERT模型中的经典自注意力机制层，并利用粒子群优化（PSO）算法确定采样因子的最优值，在降低模型复杂度的同时确保模型性能不变。在人工标注的电力领域专利文本数据集上进行了分词性能测试。实验结果表明，所提方法在该数据集分词任务中的F1值达到了92.87%，相较于隐马尔可夫模型（HMM）、多标准分词模型METASEG（pre-training model with META learning for Chinese word SEGmentation）与词典增强型BERT（LEBERT）模型分别提高了14.70、9.89与3.60个百分点，验证了所提方法有效提高了电力领域中文文本的分词质量。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

24. 基于改进YOLOv8的水下目标检测算法

李大海, 李冰涛, 王振东

《计算机应用》唯一官方网站 2024, 44 (11): 3610-3616. DOI: 10.11772/j.issn.1001-9081.2023111550

摘要（582）

HTML （20）

PDF （1637KB）（693）

由于水下生物的特性，水下图像中存在较多难以检测的小目标，且目标之间经常相互遮挡，而水下环境中的光线吸收和散射也会造成水下图像的颜色偏移和模糊。针对上述问题，提出水下目标检测算法WCA-YOLOv8。首先，设计特征融合模块（FFM），增强对空间维度信息的关注，提升对模糊和颜色偏移目标的识别能力；其次，加入FCA（FReLU Coordinate Attention）模块，增强对相互重叠、遮挡水下目标的特征提取能力；再次，为了提高模型对水下小目标的检测性能，将完整交并比（CIoU）损失函数替换为WIoU v3（Wise-IoU version 3）损失函数；最后，设计下采样增强模块（DEM），使特征提取过程中保存的上下文信息更完整，改善水下目标检测的性能。RUOD和URPC数据集上的实验结果表明，WCA-YOLOv8的检测平均精度均值（mAP_0.5）分别为75.8%和88.6%，检测速度分别为60 frame/s和57 frame/s。与其他前沿的水下物体检测算法相比，WCA-YOLOv8不仅能够获得更高的检测准确性，还可达到更快的检测速度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

25. 超边约束的异质超网络表示学习方法

王可可, 朱宇, 王晓英, 黄建强, 曹腾飞

《计算机应用》唯一官方网站 2023, 43 (12): 3654-3661. DOI: 10.11772/j.issn.1001-9081.2022121908

摘要（581）

HTML （35）

PDF （2264KB）（245）

与普通网络相比，超网络具有复杂的元组关系（超边），然而现有的大多数网络表示学习方法并不能捕获元组关系。针对上述问题，提出一种超边约束的异质超网络表示学习方法（HRHC）。首先，引入一种结合团扩展和星型扩展的方法，从而将异质超网络转换为异质网络；其次，引入感知节点语义相关性的元路径游走方法捕获异质节点之间的语义关系；最后，通过超边约束机制捕获节点之间的元组关系，从而获得高质量的节点表示向量。在3个真实世界的超网络数据集上的实验结果表明，对于链接预测任务，所提方法在drug、GPS和MovieLens数据集上都取得了较好的结果；对于超网络重建任务，当超边重建比率大于0.6时，所提方法在drug数据集上的准确性（ACC）优于次优的Hyper2vec（biased 2nd order random walks in Hyper-networks），同时所提方法在GPS数据集上的ACC超过其他基线方法中次优的基于关联图的超边超边约束的异质超网络表示学习方法（HRHC-关联图）15.6个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

26. 多任务优化算法及应用研究综述

武越, 丁航奇, 何昊, 毕顺杰, 江君, 公茂果, 苗启广, 马文萍

《计算机应用》唯一官方网站 2024, 44 (5): 1338-1347. DOI: 10.11772/j.issn.1001-9081.2024020209

摘要（575）

HTML （53）

PDF （1486KB）（1487）

进化多任务优化（EMTO）是进化计算中一种新型方法，它可以同时解决多个相关的优化任务，并通过任务之间的知识转移增强每个任务的优化。近年来，越来越多的进化多任务优化相关研究致力于利用它强大的并行搜索能力和降低计算成本的潜力优化各种问题，并且EMTO已应用于各种各样的实际场景当中。从EMTO的原理、核心设计、应用以及挑战四个方面对EMTO的算法及应用进行了讨论。首先介绍了EMTO的大致分类，分别从两个层次、四个方面介绍，包括单种群多任务、多种群多任务、辅助任务形式以及多形式任务形式；其次介绍EMTO的核心组件设计，包括任务构建以及知识转移；最后对它的各种应用场景进行介绍，并对今后研究做了总结与展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

27. 基于改进YOLOv8n的无人机视角下小目标检测算法

刘涛, 鞠事宏, 高一萌

《计算机应用》唯一官方网站 2024, 44 (11): 3603-3609. DOI: 10.11772/j.issn.1001-9081.2023111644

摘要（575）

HTML （24）

PDF （1561KB）（303）

针对目标检测算法在无人机视角下的小目标检测中精度低的问题，通过改进YOLOv8的骨干网络与注意力机制，提出一种新的小目标检测算法SFM-YOLOv8。首先，在骨干网络中融入适用于低分辨率图像和小物体检测的空间深度转换卷积（SPDConv），保留判别特征信息，提高小目标感知能力；其次，插入多分支注意力MCA（Multiple Coordinate Attention），加强提取特征层的空间信息和通道信息；然后，构建一种融合FasterNet和高效多尺度注意力（EMA）的卷积FE-C2f，减少计算量并使模型轻量化；此外，引入边界框相似度比较度量（MPDIoU）损失函数提高算法精度；最后，在YOLOv8n的网络结构中增加小目标检测层，保留更多关于小目标的位置信息和细节特征。实验结果表明，与YOLOv8n相比，SFM-YOLOv8算法在VisDrone-DET2019数据集上的平均精度均值mAP₅₀提高了4.37个百分点，参数量减少了5.98%；与相关主流模型对比，精度也有所提升，且满足实时检测需求。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

28. 结合LSTM和自注意力机制的图卷积网络短期电力负荷预测

史含笑, 王雷春

《计算机应用》唯一官方网站 2024, 44 (1): 311-317. DOI: 10.11772/j.issn.1001-9081.2023010078

摘要（574）

HTML （20）

PDF （2173KB）（355）

针对现有电力负荷预测模型建模工作量大、时空联合表征不足、预测精度低等问题，提出了一种结合长短期记忆（LSTM）网络和自注意力机制的图卷积网络（GCN）的短期电力负荷预测模型GCNLS-STLF。首先，利用LSTM和自注意力机制将原始多维时间序列数据转化为包含序列间关联关系的电力负荷图；然后，通过GCN、LSTM和图傅里叶变换（GFT）对电力负荷图进行特征提取；最后，使用全连接层对特征进行重构，并利用残差进行多次预测，以增强原始电力负荷数据的表达能力。在摩洛哥与巴拿马某电站的真实历史电力负荷数据上进行的短期电力负荷预测实验结果显示，与支持向量机（SVM）、LSTM、混合模型CNN-LSTM和基于注意力的CNN-LSTM（CNN-LSTM-attention）等预测模型相比，GCNLS-STLF在摩洛哥全部电力负荷测试集上的平均绝对百分比误差（MAPE）分别降低1.94、0.90、0.49和0.37个百分点；在巴拿马电力负荷测试集上的3月份MAPE分别降低1.39、0.94、0.38和0.29个百分点，6月份MAPE分别降低1.40、0.99、0.35和0.28个百分点。实验结果表明，GCNLS-STLF能有效提取电力负荷的关键特征，预测效果较好。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

29. L1正则化的深度谱聚类算法

李文博, 刘波, 陶玲玲, 罗棻, 张航

《计算机应用》唯一官方网站 2023, 43 (12): 3662-3667. DOI: 10.11772/j.issn.1001-9081.2022121822

摘要（571）

HTML （44）

PDF （1465KB）（386）

针对深度谱聚类模型训练不稳定和泛化能力弱等问题，提出L1正则化的深度谱聚类算法（DSCLR）。首先，在深度谱聚类的目标函数中引入L1正则化，使深度神经网络模型生成的拉普拉斯矩阵的特征向量稀疏化，并提升模型的泛化能力；其次，通过利用参数化修正线性单元激活函数（PReLU）改进基于深度神经网络的谱聚类算法的网络结构，解决模型训练不稳定和欠拟合问题。在MNIST数据集上的实验结果表明，所提算法在聚类精度（CA）、归一化互信息（NMI）指数和调整兰德系数（ARI）这3个评价指标上，相较于深度谱聚类算法分别提升了11.85、7.75和17.19个百分点。此外，所提算法相较于深度嵌入聚类（DEC）和基于对偶自编码器网络的深度谱聚类（DSCDAN）等算法，在CA、NMI和ARI这3个评价指标上也有大幅提升。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

30. 基于改进YOLOv5的Logo检测算法

李烨恒, 罗光圣, 苏前敏

《计算机应用》唯一官方网站 2024, 44 (8): 2580-2587. DOI: 10.11772/j.issn.1001-9081.2023081113

摘要（568）

HTML （12）

PDF （4682KB）（686）

针对Logo图像背景复杂、Logo目标尺寸多变的问题，提出了一种基于YOLOv5的改进检测算法。首先，结合CBAM（Channel Block Attention Module），分别在图像通道与空间方向进行压缩，提取图像的关键信息与重要区域；然后，使用可变空洞卷积（SAC）使网络在不同尺度下自适应地调整特征图中的感受野大小，以捕获不同尺度下的物体信息，改善网络对多尺度目标的检测效果；最后，将归一化Wasserstein距离（NWD）嵌入损失函数，将边界框建模成2D的高斯分布，计算对应的高斯分布之间的相似度，更好地度量目标之间的相似性，提高对小目标的检测性能与模型鲁棒性和稳定性。实验结果表明，在数据量较小的数据集FlickrLogos-32中，改进后算法的平均精度均值（mAP@0.5）达到90.6%，比原始YOLOv5算法提升了1个百分点；在数据量较大的数据集QMULOpenLogo中，改进后算法的mAP@0.5达到62.7%，比原始YOLOv5算法提升了2.3个百分点；在针对特定类型的Logo检测集LogoDet3K中，针对3类商标改进后算法比原始算法的mAP@0.5分别提升了1.2、1.4与1.4个百分点，说明它有更好的Logo图像小目标检测能力。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

31. 结合遗传算法和滚动调度的多机器人任务分配算法

邓辅秦, 黄焕钊, 谭朝恩, 付兰慧, 张建民, 林天麟

《计算机应用》唯一官方网站 2023, 43 (12): 3833-3839. DOI: 10.11772/j.issn.1001-9081.2022121916

摘要（564）

HTML （12）

PDF （2617KB）（288）

研究多机器人任务分配（MRTA）的目的是提高智能工厂中机器人完成任务的效率。针对现有算法在处理大规模、多约束的MRTA时存在不足的问题，提出一种结合遗传算法和滚动调度的MRTA算法（ACGARS）。首先，在遗传算法中采用基于有向无环图（DAG）的编码方式高效地处理任务之间的优先级约束；其次，在遗传算法的初始种群中加入先验知识以提高算法的搜索效率；最后，设计基于任务组的滚动调度策略用于减小求解问题的规模，从而实现对大规模问题的高效求解。在大规模问题实例上的实验结果表明，相较于构造性启发式算法（CHA）、最小化干扰算法（MIA）和基于惩罚策略的遗传算法（GAPS）生成的方案，当任务组数为20时，所提算法生成的方案的平均订单完成时间分别缩短了30.02%、16.86%和75.65%，验证了所提算法能有效地缩短订单的平均等待时间，提升多机器人任务分配效率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

32. 基于分离式标签协同学习的YOLOv5多属性分类

李鑫, 孟乔, 皇甫俊逸, 孟令辰

《计算机应用》唯一官方网站 2024, 44 (5): 1619-1628. DOI: 10.11772/j.issn.1001-9081.2023050675

摘要（562）

HTML （17）

PDF （4949KB）（1200）

针对图像分类任务中卷积网络提取图像细粒度特征能力不足、多属性之间的依赖关系无法识别的问题，提出一种基于YOLOv5的车辆多属性分类方法Multi-YOLOv5。该方法设计了多头非极大值抑制（Multi-NMS）和分离式标签损失（Separate-Loss）函数协同工作机制实现车辆的多属性分类任务，并采用卷积块注意力模块（CBAM）、SA（Shuffle Attention）和CoordConv方法重构了YOLOv5检测模型，分别从提升多属性特征能力提取、增强不同属性之间的关联关系、增强网络对位置信息的感知能力三方面提升模型对目标多属性分类的精准性。在VeRi等数据集上进行了训练与测试，实验结果表明，与基于GoogLeNet、残差网络（ResNet）、EfficientNet、ViT（Vision Transformer）等的网络结构相比，Multi-YOLOv5方法在目标的多属性分类方面取得了较好的识别结果，在VeRi数据集上，它的平均精度均值（mAP）达到了87.37%，较上述表现最佳的方法提高了4.47个百分点，且比原YOLOv5模型具有更好的鲁棒性，能为密集环境下的交通目标感知提供可靠的数据信息。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

33. 基于轻量化YOLOv5的新型菜品识别网络

张成涵宇, 林钰哲, 谭程珂, 王俊帆, 顾烨婷, 董哲康, 高明煜

《计算机应用》唯一官方网站 2024, 44 (2): 638-644. DOI: 10.11772/j.issn.1001-9081.2023030271

摘要（560）

HTML （22）

PDF （2914KB）（1160）

为了更好地满足中餐菜品识别对准确性和时效性的应用需求，设计一种新型的菜品识别网络。在原YOLOv5模型的基础上，结合Supermask方法与结构化通道剪枝对模型进行剪枝操作，并利用Int8量化技术最终实现对模型的轻量化处理，保证模型在菜品识别中兼顾准确率和速度，同时提高模型的可移植性。实验结果表明，所提模型在交并比（IoU）为0.5时，平均精度均值（mAP）达到99.00%，平均每帧识别时间达到59.54 ms，相较于原始YOLOv5降低了20 ms，且准确率基本保持一致。此外，利用Qt软件将新型菜品识别网络移植到瑞萨RZ/G2L开发板，构建智能出餐系统，可实现点餐、生成订单、自动出餐全流程，为未来真正的餐厅智能出餐系统的构建应用提供了理论与实践基础。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

34. 基于最大熵深度强化学习的双足机器人步态控制方法

李源潮, 陶重犇, 王琛

《计算机应用》唯一官方网站 2024, 44 (2): 445-451. DOI: 10.11772/j.issn.1001-9081.2023020153

摘要（551）

HTML （11）

PDF （2699KB）（813）

针对双足机器人连续直线行走的步态稳定控制问题，提出一种基于最大熵深度强化学习（DRL）的柔性演员-评论家（SAC）步态控制方法。首先，该方法无需事先建立准确的机器人动力学模型，所有参数均来自关节角而无需额外的传感器；其次，采用余弦相似度方法对经验样本分类，优化经验回放机制；最后，根据知识和经验设计奖励函数，使双足机器人在直线行走训练过程中不断进行姿态调整，确保直线行走的鲁棒性。在Roboschool仿真环境中与其他先进深度强化学习算法，如近端策略优化（PPO）方法和信赖域策略优化（TRPO）方法的实验对比结果表明，所提方法不仅实现了双足机器人快速稳定的直线行走，而且鲁棒性更好。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

35. 基于生成式对抗网络的联邦学习激励机制

余孙婕, 曾辉, 熊诗雨, 史红周

《计算机应用》唯一官方网站 2024, 44 (2): 344-352. DOI: 10.11772/j.issn.1001-9081.2023020244

摘要（542）

HTML （28）

PDF （2639KB）（627）

针对当前联邦学习缺乏公平合理的激励机制，难以衡量不同数据量、不同数据质量、不同数据分布的参与节点的联邦学习贡献度等问题，提出一种基于生成式对抗网络（GAN）的联邦学习激励机制。首先，提出融合训练模型的生成式对抗网络实现高精度样本生成；随后，基于融合训练模型的生成式对抗网络实现激励机制的贡献度评估算法，该算法通过联合模型筛选样本并生成数据标签，引入参与节点的本地数据标签分布平衡非独立同分布数据标签对贡献度评估的影响；最后，使用两阶段Stackelberg博弈实现联邦学习激励过程。安全性分析结果表明，所提激励机制在联邦学习过程中保证数据安全和系统稳定。实验结果表明，所提激励机制具备正确性，贡献度评估算法在不同数据量、不同数据质量和不同数据分布的情况下均有较好的性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

36. 代码相似性检测技术综述

孙祥杰, 魏强, 王奕森, 杜江

《计算机应用》唯一官方网站 2024, 44 (4): 1248-1258. DOI: 10.11772/j.issn.1001-9081.2023040551

摘要（533）

HTML （19）

PDF （1868KB）（2330）

代码复用为软件开发带来便利的同时也引入了安全风险，如加速漏洞传播、代码恶意抄袭等，代码相似性检测技术通过分析代码间词法、语法、语义等信息计算代码相似程度，是判断代码复用最有效的技术之一，也是近年发展较快的程序安全分析技术。首先，系统梳理代码相似性检测的近期技术进展，根据目标代码是否开源，将代码相似性检测技术分为源码相似性检测和二进制代码相似性检测，又根据编程语言、指令集的不同进行二次细分；其次，总结每一种技术的思路和研究成果，分析机器学习技术在代码相似性检测领域成功的案例，并讨论现有技术的优势与不足；最后，给出代码相似性检测技术的发展趋势，为相关研究人员提供参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

37. 基于语义引导自注意力网络的换衣行人重识别模型

钟建华, 邱创一, 巢建树, 明瑞成, 钟剑锋

《计算机应用》唯一官方网站 2023, 43 (12): 3719-3726. DOI: 10.11772/j.issn.1001-9081.2022121875

摘要（532）

HTML （19）

PDF （2046KB）（275）

针对换衣行人重识别（ReID）任务中有效信息提取困难的问题，提出一种基于语义引导自注意力网络的换衣ReID模型。首先，利用语义信息将图像分割出无服装图像，和原始图像一起输入双分支多头自注意力网络进行计算，分别得到衣物无关特征和完整行人特征。其次，利用全局特征重建模块（GFR），重建两种全局特征，得到的新特征中服装区域包含换衣任务中鲁棒性更好的头部特征，使得全局特征中的显著性信息更突出；利用局部特征重组重建模块（LFRR），在完整图像特征和无服装图像特征中提取头部和鞋部局部特征，强调头部和鞋部特征的细节信息，并减少换鞋造成的干扰。最后，除了使用行人重识别中常用的身份损失和三元组损失，提出特征拉近损失（FPL），拉近局部与全局特征、完整图像特征与无服装图像特征之间的距离。在PRCC（Person ReID under moderate Clothing Change）和VC-Clothes（Virtually Changing-Clothes）数据集上，与基于衣物对抗损失（CAL）模型相比，所提模型的平均精确率均值（mAP）分别提升了4.6和0.9个百分点；在Celeb-reID和Celeb-reID-light数据集上，与联合损失胶囊网络（JLCN）模型相比，所提模型的mAP分别提升了0.2和 5.0个百分点。实验结果表明，所提模型在换衣场景中突出有效信息表达方面具有一定优势。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

38. 时频域多尺度交叉注意力融合的时间序列分类方法

王美, 苏雪松, 刘佳, 殷若南, 黄珊

《计算机应用》唯一官方网站 2024, 44 (6): 1842-1847. DOI: 10.11772/j.issn.1001-9081.2023060731

摘要（525）

HTML （12）

PDF （2511KB）（962）

针对时间序列子序列间的潜在信息交互不足导致分类准确率低的问题，提出时频域多尺度交叉注意力融合的时间序列分类方法TFFormer（Time-Frequency Transformer）。首先，将原始时间序列的时频域谱分别划分为等长子序列，经线性投影后加入位置信息解决时间序列的点值耦合问题；其次，通过改进的多头自注意力（IMHA）模块使模型关注更重要的序列特征，解决长时间序列的前后依赖问题；最后，构造多尺度时频域交叉注意力（CMA）模块增强时间序列在时域和频域之间的信息交互，使模型进一步挖掘序列的频域信息。实验结果表明，在Trace、StarLightCurves和UWaveGestureLibraryAll数据集上，相较于全卷积网络（FCN），所提方法的分类准确率分别提高了0.3、0.9和1.4个百分点，验证了通过增强时间序列时域和频域间的信息交互，可以提高模型收敛速度和分类精度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

39. 基于改进实数编码遗传算法的神经网络超参数优化

佘维, 李阳, 钟李红, 孔德锋, 田钊

《计算机应用》唯一官方网站 2024, 44 (3): 671-676. DOI: 10.11772/j.issn.1001-9081.2023040441

摘要（523）

HTML （58）

PDF （1532KB）（576）

针对神经网络超参数优化效果差、容易陷入次优解和优化效率低的问题，提出一种基于改进实数编码遗传算法（IRCGA）的深度神经网络超参数优化算法——IRCGA-DNN（IRCGA for Deep Neural Network）。首先，采用实数编码方式表示超参数的取值，使超参数的搜索空间更灵活；然后，引入分层比例选择算子增加解集多样性；最后，分别设计了改进的单点交叉和变异算子，以更全面地探索超参数空间，提高优化算法的效率和质量。基于两个仿真数据集，验证IRCGA-DNN的毁伤效果预测性能和收敛效率。实验结果表明，在两个数据集上，与GA-DNN（Genetic Algorithm for Deep Neural Network）相比，所提算法的收敛迭代次数分别减少了8.7%和13.6%，均方误差（MSE）相差不大；与IGA-DNN（Improved GA-DNN）相比，IRCGA-DNN的收敛迭代次数分别减少了22.2%和13.6%。实验结果表明，所提算法收敛速度和预测性能均更优，能有效处理神经网络超参数优化问题。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

40. 基于深度强化学习的移动机器人三维路径规划方法

马天, 席润韬, 吕佳豪, 曾奕杰, 杨嘉怡, 张杰慧

《计算机应用》唯一官方网站 2024, 44 (7): 2055-2064. DOI: 10.11772/j.issn.1001-9081.2023060749

摘要（521）

HTML （30）

PDF （5732KB）（1052）

针对三维未知环境中存在的高复杂度和不确定性的问题，提出一种在有限观测空间优化策略下基于深度强化学习的移动机器人三维路径规划方法。首先，在有限观测空间下采用深度图信息作为智能体的输入，模拟移动受限且未知的复杂三维空间环境；其次，设计了两阶段离散动作空间下的动作选择策略，包括方向动作和位移动作，以减少搜索步数和时间；最后，在近端策略优化（PPO）算法基础上，添加门控循环单元（GRU）结合历史状态信息，以提升未知环境中搜索策略的稳定性，进而提高规划路径准确度和平滑度。实验结果表明，相较于A2C（Advantage Actor-Critic），所提方法的平均搜索时间缩短了49.07%，平均规划路径长度缩短了1.04%，同时能够完成线性时序逻辑约束下的多目标路径规划任务。

图表 | 参考文献 | 相关文章 | 多维度评价

摘要点击排行