《计算机应用》唯一官方网站

Select

1. 知识图谱综述——表示、构建、推理与知识超图理论

田玲, 张谨川, 张晋豪, 周望涛, 周雪

《计算机应用》唯一官方网站 2021, 41 (8): 2161-2186. DOI: 10.11772/j.issn.1001-9081.2021040662

摘要（2872）

PDF （2811KB）（3782）

针对知识图谱（KG）在知识驱动的人工智能研究中发挥的强大支撑作用，分析并总结了现有知识图谱和知识超图技术。首先，从知识图谱的定义与发展历程出发，介绍了知识图谱的分类和架构；其次，对现有的知识表示与存储方式进行了阐述；然后，基于知识图谱的构建流程，分析了各类知识图谱构建技术的研究现状。特别是针对知识图谱中的知识推理这一重要环节，分析了基于逻辑规则、嵌入表示和神经网络的三类典型的知识推理方法。此外，以异构超图引出知识超图的研究进展，并提出三层架构的知识超图，从而更好地表示和提取超关系特征，实现对超关系数据的建模及快速的知识推理。最后，总结了知识图谱和知识超图的典型应用场景并对未来的研究作出了展望。

参考文献 | 相关文章 | 多维度评价

Select

2. 自然语言生成综述

李雪晴, 王石, 王朱君, 朱俊武

《计算机应用》唯一官方网站 2021, 41 (5): 1227-1235. DOI: 10.11772/j.issn.1001-9081.2020071069

摘要（2640）

PDF （1165KB）（3683）

自然语言生成（NLG）技术利用人工智能和语言学的方法来自动地生成可理解的自然语言文本。NLG降低了人类和计算机之间沟通的难度，被广泛应用于机器新闻写作、聊天机器人等领域，已经成为人工智能的研究热点之一。首先，列举了当前主流的NLG的方法和模型，并详细对比了这些方法和模型的优缺点；然后，分别针对文本到文本、数据到文本和图像到文本等三种NLG技术，总结并分析了应用领域、存在的问题和当前的研究进展；进而，阐述了上述生成技术的常用评价方法及其适用范围；最后，给出了当前NLG技术的发展趋势和研究难点。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于深度学习的事件因果关系抽取综述

王朱君, 王石, 李雪晴, 朱俊武

《计算机应用》唯一官方网站 2021, 41 (5): 1247-1255. DOI: 10.11772/j.issn.1001-9081.2020071080

摘要（2839）

PDF （1460KB）（3348）

因果关系抽取是自然语言处理（NLP）中的一种关系抽取任务，它通过构造事件图来挖掘文本中具有因果关系的事件对，已经在金融、安全、生物等领域的应用中发挥重要作用。首先，介绍了事件抽取和因果关系等概念，并介绍了因果关系抽取主流方法的演变和常用数据集；然后，列举了当前主流的因果关系抽取模型，并且在分别对基于流水线的模型和联合抽取模型进行详细分析的基础上，对比了各种方法和模型的优缺点；此外，对各模型的实验性能及相关实验数据进行了归纳分析；最后，给出了当前的因果关系抽取的研究难点和未来的重点研究方向。

参考文献 | 相关文章 | 多维度评价

Select

4. 面向自然语言处理任务的预训练模型综述

刘睿珩, 叶霞, 岳增营

《计算机应用》唯一官方网站 2021, 41 (5): 1236-1246. DOI: 10.11772/j.issn.1001-9081.2020081152

摘要（890）

PDF （1296KB）（3007）

近年来，深度学习技术得到了快速发展。在自然语言处理（NLP）任务中，随着文本表征技术从词级上升到了文档级，利用大规模语料库进行无监督预训练的方式已被证明能够有效提高模型在下游任务中的性能。首先，根据文本特征提取技术的发展，从词级和文档级对典型的模型进行了分析；其次，从预训练目标任务和下游应用两个阶段，分析了当前预训练模型的研究现状，并对代表性的模型特点进行了梳理和归纳；最后，总结了当前预训练模型发展所面临的主要挑战并提出了对未来的展望。

参考文献 | 相关文章 | 多维度评价

Select

5. 联邦学习通信开销研究综述

邱鑫源, 叶泽聪, 崔翛龙, 高志强

《计算机应用》唯一官方网站 2022, 42 (2): 333-342. DOI: 10.11772/j.issn.1001-9081.2021020232

摘要（1808）

HTML （290）

PDF （1356KB）（2330）

为了解决数据共享需求与隐私保护要求之间不可调和的矛盾，联邦学习应运而生。联邦学习作为一种分布式机器学习，其中的参与方与中央服务器之间需要不断交换大量模型参数，而这造成了较大通信开销；同时，联邦学习越来越多地部署在通信带宽有限、电量有限的移动设备上，而有限的网络带宽和激增的客户端数量会使通信瓶颈加剧。针对联邦学习的通信瓶颈问题，首先分析联邦学习的基本工作流程；然后从方法论的角度出发，详细介绍基于降低模型更新频率、模型压缩、客户端选择的三类主流方法和模型划分等特殊方法，并对具体优化方案进行深入的对比分析；最后，对联邦学习通信开销技术研究的发展趋势进行了总结和展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 联邦学习综述：概念、技术、应用与挑战

梁天恺, 曾碧, 陈光

《计算机应用》唯一官方网站 2022, 42 (12): 3651-3662. DOI: 10.11772/j.issn.1001-9081.2021101821

摘要（2608）

HTML （160）

PDF （2464KB）（1810）

在强调数据确权以及隐私保护的时代背景下，联邦学习作为一种新的机器学习范式，能够在不暴露各方数据的前提下达到解决数据孤岛以及隐私保护问题的目的。目前，基于联邦学习的建模方法已成为主流并且获得了很好的效果，因此对联邦学习的概念、技术、应用和挑战进行总结与分析具有重要的意义。首先，阐述了机器学习的发展历程以及联邦学习出现的必然性，并给出联邦学习的定义与分类；其次，介绍并分析了目前业界认可的三种联邦学习方法：横向联邦学习、纵向联邦学习和联邦迁移学习；然后，针对联邦学习的隐私保护问题，归纳并总结了目前常见的隐私保护技术；此外，还对联邦学习的现有主流开源框架进行了介绍与对比，同时给出了联邦学习的应用场景；最后，展望了联邦学习所面临的挑战和未来的研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 基于改进DCGAN的数据增强方法

甘岚, 沈鸿飞, 王瑶, 张跃进

计算机应用 2021, 41 (5): 1305-1313. DOI: 10.11772/j.issn.1001-9081.2020071059

摘要（1071）

PDF （1499KB）（1547）

针对小样本数据在深度学习中训练难的问题，为提高DCGAN训练效率，提出了一种改进的DCGAN算法对小样本数据进行增强。首先，使用Wasserstein距离替换原模型中的损失模型；其次，在生成网络和判别网络中加入谱归一化，以得到稳定的网络结构；最后，通过极大似然估计算法和实验估算得到样本的最佳噪声输入维度，从而提高生成样本的多样性。在MNIST、CelebA和Cartoon这三个数据集上的实验结果表明：改进后的DCGAN所生成样本的清晰度以及识别率比改进前均得到了明显提高，其中平均识别率在这几个数据集上分别提高了8.1%、16.4%和16.7%，几种清晰度评价指标在各数据集上均有不同程度的提高。可见该方法能够有效地实现小样本数据增强。

参考文献 | 相关文章 | 多维度评价

Select

8. 无人机协同控制研究综述

马子玉, 何明, 刘祖均, 顾凌枫, 刘锦涛

计算机应用 2021, 41 (5): 1477-1483. DOI: 10.11772/j.issn.1001-9081.2020081314

摘要（680）

PDF （1364KB）（1496）

无人机（UAV）协同控制是指一组UAV以机间通信为基础、群体智能为核心，合作分工完成某一共同任务的控制方式。UAV集群是拥有一定自主能力的大量UAV基于局部规则执行各项任务的多智能体系统，与单架UAV相比，UAV集群有着高效率、高灵活性和高可靠性等优点。针对近几年UAV协同控制技术的最新发展动态，首先，从民用和军事两个角度举例说明多UAV技术的应用前景；接着，对比分析一致性控制、蜂拥控制和编队控制这三种主流协同控制方式的区别与发展现状；最后，对协同控制面临的时延、避障和续航等问题提出几点建议，为未来UAV协同控制研究发展提供一定帮助。

参考文献 | 相关文章 | 多维度评价

Select

9. 时空轨迹序列模式挖掘方法综述

康军, 黄山, 段宗涛, 李宜修

《计算机应用》唯一官方网站 2021, 41 (8): 2379-2385. DOI: 10.11772/j.issn.1001-9081.2020101571

摘要（953）

PDF （1204KB）（1478）

在全球定位、移动通信技术迅速发展的背景下涌现出了海量的时空轨迹数据，这些数据是对移动对象在时空环境下的移动模式和行为特征的真实写照，蕴含了丰富的信息，这些信息对于城市规划、交通管理、服务推荐、位置预测等领域具有重要的应用价值，而时空轨迹数据在这些领域的应用通常需要通过对时空轨迹数据进行序列模式挖掘才能得以实现。时空轨迹序列模式挖掘旨在从时空轨迹数据集中找出频繁出现的序列模式，例如：位置模式（频繁轨迹、热点区域）、活动周期模式、语义行为模式，从而挖掘时空数据中隐藏的信息。总结近年来时空轨迹序列模式挖掘的研究进展，先介绍时空轨迹序列的数据特点及应用，再描述时空轨迹模式的挖掘过程：从基于时空轨迹序列来挖掘位置模式、周期模式、语义模式这三个方面来介绍该领域的研究情况，最后阐述现有时空轨迹序列模式挖掘方法存在的问题，并展望时空轨迹序列模式挖掘方法未来的发展趋势。

参考文献 | 相关文章 | 多维度评价

Select

10. 深度学习在天气预报领域的应用分析及研究进展综述

董润婷, 吴利, 王晓英, 曹腾飞, 黄建强, 管琴, 吴洁瑕

《计算机应用》唯一官方网站 2023, 43 (6): 1958-1968. DOI: 10.11772/j.issn.1001-9081.2022050745

摘要（1233）

HTML （93）

PDF （1570KB）（1440）

随着传感器网络和全球定位系统等技术的进步，兼有时间与空间特性的气象数据体量呈爆炸式增长，针对时空序列预测（STSF）的深度学习模型研究得到了迅猛发展。然而，长期以来用于天气预报的传统机器学习方法在提取数据的时间相关性与空间依赖性方面的效果往往并不理想。与此同时，深度学习方法通过人工神经网络自动提取特征，可以有效提高天气预报的准确度，并且在编码长期空间信息的建模方面有相当优秀的效果。同时，由观测数据驱动的深度学习模型与基于物理理论的数值天气预报（NWP）模型结合的方式可以构建拥有更高预测精度与更长预报时间的混合模型。基于这些，将深度学习在天气预报领域的应用分析及研究进展进行了综述。首先，将天气预报领域的深度学习问题与经典深度学习问题从数据格式、问题模型与评价指标这3个方面进行了对比研究；然后，回顾了深度学习在天气预报领域的发展历程与应用现状，并总结分析了深度学习技术与NWP结合的最新进展；最后，展望了未来的发展方向和研究重点，为天气预报领域的深度学习研究提供参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

11. 基于混沌麻雀搜索算法的无人机航迹规划方法

汤安迪, 韩统, 徐登武, 谢磊

计算机应用 2021, 41 (7): 2128-2136. DOI: 10.11772/j.issn.1001-9081.2020091513

摘要（1039）

PDF （1479KB）（1435）

针对无人机（UAV）航迹规划求解计算量大、难收敛等问题，提出了一种基于混沌麻雀搜索算法（CSSA）的航迹规划方法。首先，建立二维任务空间模型与航迹代价模型，将航迹规划问题转化为多维函数优化问题；其次，采用立方映射初始化种群，并使用反向学习策略（OBL）引入精英粒子，增强种群多样性，扩大搜索区域范围；然后，引入正弦余弦算法（SCA），并采用线性递减策略平衡算法的开发与探索能力，当算法陷入停滞时，采用高斯游走策略帮助算法跳出局部最优；最后，将提出的改进算法在15个基准测试函数中进行性能验证，并应用于航迹规划问题求解。仿真结果表明，CSSA的寻优性能优于粒子群优化（PSO）算法、天牛群优化（BSO）算法、鲸鱼优化算法（WOA）、灰狼优化（GWO）算法和麻雀搜索算法（SSA），并且能够快速地得到一条代价最优、满足约束的安全可行航迹，验证了所提方法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

12. 基于深度学习的医学影像分割研究综述

曹玉红, 徐海, 刘荪傲, 王紫霄, 李宏亮

《计算机应用》唯一官方网站 2021, 41 (8): 2273-2287. DOI: 10.11772/j.issn.1001-9081.2020101638

摘要（1735）

PDF （2539KB）（1420）

医学影像分割是计算机辅助诊断中的一项基础且关键的任务，目的在于从像素级别准确识别出目标器官、组织或病变区域。不同于自然场景下的图像，医学影像往往纹理复杂，同时受限于成像技术和成像设备，医学影像噪声大，边界模糊而不易判断。除此之外，对医学影像进行标注极大依赖于医疗专家的认知和经验，因此可用于训练中的标注数据少且存在标注误差。由于上述的医学影像边缘模糊不清、训练数据较少和标注误差较大等特点，基于传统图像分割算法搭建的辅助诊断系统难以满足临床应用的要求。近年来随着卷积神经网络（CNN）在计算机视觉和自然语言处理领域的广泛应用，基于深度学习的医学影像分割算法取得了极大的成功。首先概述了近几年基于深度学习的医学影像分割的研究进展，包括这些医学影像分割算法的基本结构、目标函数和优化方法。随后针对医学影像标注数据有限的问题，对目前半监督条件下医学影像分割的主流工作进行了整理归纳和分析。此外，还介绍了针对标注误差进行不确定度分析的相关工作。最后，总结分析了深度学习医学影像分割的特点并展望了未来的研究趋势。

参考文献 | 相关文章 | 多维度评价

Select

13. 基于深度学习的多模态医学图像分割综述

窦猛, 陈哲彬, 王辛, 周继陶, 姚宇

《计算机应用》唯一官方网站 2023, 43 (11): 3385-3395. DOI: 10.11772/j.issn.1001-9081.2022101636

摘要（1527）

HTML （55）

PDF （3904KB）（1367）

多模态医学图像可以为临床医生提供靶区（如肿瘤、器官或组织）的丰富信息。然而，由于多模态图像之间相互独立且仅有互补性，如何有效融合多模态图像并进行分割仍是亟待解决的问题。传统的图像融合方法难以有效解决此问题，因此基于深度学习的多模态医学图像分割算法得到了广泛的研究。从原理、技术、问题及展望等方面对基于深度学习的多模态医学图像分割任务进行了综述。首先，介绍了深度学习与多模态医学图像分割的一般理论，包括深度学习与卷积神经网络（CNN）的基本原理与发展历程，以及多模态医学图像分割任务的重要性；其次，介绍了多模态医学图像分割的关键概念，包括数据维度、预处理、数据增强、损失函数以及后处理等；接着，对基于不同融合策略的多模态分割网络进行综述，对不同方式的融合策略进行分析；最后，对医学图像分割过程中常见的几个问题进行探讨，并对今后研究作了总结与展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

14. 在线教育学习者知识追踪综述

赵雅娟孟繁军徐行健

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2023060852
预出版日期: 2023-11-07

Select

15. 推荐系统综述

于蒙, 何文涛, 周绪川, 崔梦天, 吴克奇, 周文杰

《计算机应用》唯一官方网站 2022, 42 (6): 1898-1913. DOI: 10.11772/j.issn.1001-9081.2021040607

摘要（1688）

HTML （146）

PDF （3152KB）（1348）

随着网络应用的不断发展，网络资源呈指数型增长，信息过载现象日益严重，如何高效获取符合需求的资源成为困扰人们的问题之一。推荐系统能对海量信息进行有效过滤，为用户推荐符合其需求的资源。对推荐系统的研究现状进行详细介绍，包括基于内容的推荐、协同过滤推荐和混合推荐这三种传统推荐方式，并重点分析了基于卷积神经网络（CNN）、深度神经网络（DNN）、循环神经网络（RNN）和图神经网络（GNN）这四种常见的深度学习推荐模型的研究进展；归纳整理了推荐领域常用的数据集，同时分析对比了传统推荐算法和基于深度学习的推荐算法的差异。最后，总结了实际应用中具有代表性的推荐模型，讨论了推荐系统面临的挑战和未来的研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

16. 基于注意力机制的特征融合-双向门控循环单元多模态情感分析

赖雪梅, 唐宏, 陈虹羽, 李珊珊

计算机应用 2021, 41 (5): 1268-1274. DOI: 10.11772/j.issn.1001-9081.2020071092

摘要（972）

PDF （960KB）（1332）

针对视频多模态情感分析中，未考虑跨模态的交互作用以及各模态贡献程度对最后情感分类结果的影响的问题，提出一种基于注意力机制的特征融合-双向门控循环单元多模态情感分析模型（AMF-BiGRU）。首先，利用双向门控循环单元（BiGRU）来考虑各模态中话语间的相互依赖关系，并得到各模态的内部信息；其次，通过跨模态注意力交互网络层将模态内部信息与模态之间的交互作用相结合；然后，引入注意力机制来确定各模态的注意力权重，并将各模态特征进行有效融合；最后，通过全连接层和softmax层获取情感分类结果。在公开的CMU-MOSI和CMU-MOSEI数据集上进行实验。实验结果表明，与传统的多模态情感分析方法（如多注意力循环网络（MARN））相比，AMF-BiGRU模型在CMU-MOSI数据集上的准确率和F1值分别提升了6.01%和6.52%，在CMU-MOSEI数据集上的准确率和F1值分别提升了2.72%和2.30%。可见，AMF-BiGRU模型能够有效提高多模态的情感分类性能。

参考文献 | 相关文章 | 多维度评价

Select

17. 自然语言处理在文本情感分析领域应用综述

王颖洁, 朱久祺, 汪祖民, 白凤波, 弓箭

《计算机应用》唯一官方网站 2022, 42 (4): 1011-1020. DOI: 10.11772/j.issn.1001-9081.2021071262

摘要（2303）

HTML （192）

PDF （783KB）（1268）

文本情感分析已经逐渐成为自然语言处理（NLP）的重要内容，并在系统推荐、用户情感信息获取，为政府、企业提供舆情参考等领域越来越占据重要地位。通过文献调研的方式，对情感分析领域的方法进行对比和综述。首先，从时间、方法等维度对情感分析的方法进行文献调研；然后，对情感分析的主要方法、应用场景进行归纳总结和对比；最后，在此基础上分析每种方法的优缺点。根据分析结果可以知道，在面对不同的任务场景，主要有三种情感分析的方法：基于情感字典的情感分析法、基于机器学习的情感分析法和基于深度学习的情感分析法，基于多策略混合的方法成为改进的趋势。文献调研表明，文本情感分析的技术方法还有改进的空间，在电子商务、心理治疗、舆情监控方面有较大市场和发展前景。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

18. 基于卷积神经网络的图像分类算法综述

季长清, 高志勇, 秦静, 汪祖民

《计算机应用》唯一官方网站 2022, 42 (4): 1044-1049. DOI: 10.11772/j.issn.1001-9081.2021071273

摘要（2130）

HTML （183）

PDF （605KB）（1263）

卷积神经网络（CNN）是目前基于深度学习的计算机视觉领域中重要的研究方向之一。它在图像分类和分割、目标检测等的应用中表现出色，其强大的特征学习与特征表达能力越来越受到研究者的推崇。然而，CNN仍存在特征提取不完整、样本训练过拟合等问题。针对这些问题，介绍了CNN的发展、CNN经典的网络模型及其组件，并提供了解决上述问题的方法。通过对CNN模型在图像分类中研究现状的综述，为CNN的进一步发展及研究方向提供了建议。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

19. 融合BERT与标签语义注意力的文本多标签分类方法

吕学强, 彭郴, 张乐, 董志安, 游新冬

《计算机应用》唯一官方网站 2022, 42 (1): 57-63. DOI: 10.11772/j.issn.1001-9081.2021020366

摘要（1405）

HTML （72）

PDF （577KB）（1234）

多标签文本分类（MLTC）是自然语言处理（NLP）领域的重要子课题之一。针对多个标签之间存在复杂关联性的问题，提出了一种融合BERT与标签语义注意力的MLTC方法TLA-BERT。首先，通过对自编码预训练模型进行微调，从而学习输入文本的上下文向量表示；然后，使用长短期记忆（LSTM）神经网络将标签进行单独编码；最后，利用注意力机制显性突出文本对每个标签的贡献，以预测多标签序列。实验结果表明，与基于序列生成模型（SGM）算法相比，所提出的方法在AAPD与RCV1-v2公开数据集上，F1值分别提高了2.8个百分点与1.5个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

20. 基于多任务学习的时序多模态情感分析模型

章荪, 尹春勇

计算机应用 2021, 41 (6): 1631-1639. DOI: 10.11772/j.issn.1001-9081.2020091416

摘要（854）

PDF （1150KB）（1204）

针对时序多模态情感分析中存在的单模态特征表示和跨模态特征融合问题，结合多头注意力机制，提出一种基于多任务学习的情感分析模型。首先，使用卷积神经网络（CNN）、双向门控循环神经网络（BiGRU）和多头自注意力（MHSA）实现了对时序单模态的特征表示；然后，利用多头注意力实现跨模态的双向信息融合；最后，基于多任务学习思想，添加额外的情感极性分类和情感强度回归任务作为辅助，从而提升情感评分回归主任务的综合性能。实验结果表明，相较于多模态分解模型，所提模型的二分类准确度指标在CMU-MOSEI和CMU-MOSI多模态数据集上分别提高了7.8个百分点和3.1个百分点。该模型适用于多模态场景下的情感分析问题，能够为商品推荐、股市预测、舆情监控等应用提供决策支持。

参考文献 | 相关文章 | 多维度评价

Select

21. 多模态预训练模型综述

王惠茹, 李秀红, 李哲, 马春明, 任泽裕, 杨丹

《计算机应用》唯一官方网站 2023, 43 (4): 991-1004. DOI: 10.11772/j.issn.1001-9081.2022020296

摘要（1474）

HTML （131）

PDF （5539KB）（1170）

PDF（mobile）（3280KB）（91）

预训练模型（PTM）通过利用复杂的预训练目标和大量的模型参数，可以有效地获得无标记数据中的丰富知识。而在多模态中，PTM的发展还处于初期。根据具体模态的不同，将目前大多数的多模态PTM分为图像?文本PTM和视频?文本PTM；根据数据融合方式的不同，还可将多模态PTM分为单流模型和双流模型两类。首先，总结了常见的预训练任务和验证实验所使用的下游任务；接着，梳理了目前多模态预训练领域的常见模型，并用表格列出各个模型的下游任务以及模型的性能和实验数据比较；然后，介绍了M6（Multi-Modality to Multi-Modality Multitask Mega-transformer）模型、跨模态提示调优（CPT）模型、VideoBERT（Video Bidirectional Encoder Representations from Transformers）模型和AliceMind（Alibaba’s collection of encoder-decoders from Mind）模型在具体下游任务中的应用场景；最后，总结了多模态PTM相关工作面临的挑战以及未来可能的研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

22. 基于深度学习的轻量级道路图像语义分割算法

胡嵽, 冯子亮

计算机应用 2021, 41 (5): 1326-1331. DOI: 10.11772/j.issn.1001-9081.2020081181

摘要（462）

PDF （1085KB）（1103）

针对深度学习中道路图像语义分割模型参数量巨大以及计算复杂，不适合于部署在移动端进行实时分割的问题，提出了一种使用深度可分离卷积构建的轻量级对称U型编码器-解码器式的图像语义分割网络MUNet。首先设计出U型编码器-解码器式网络；其次，在卷积块之间设计稀疏短连接；最后，引入了注意力机制与组归一化（GN）方法，从而在减少模型参数量以及计算量的同时提升分割精度。针对道路图像CamVid数据集，在1 000轮训练后，MUNet模型分割结果在测试图像裁剪为720×720大小时的平均交并比（MIoU）为61.92%。实验结果表明，和常见的图像语义分割网络如金字塔场景分析网络（PSPNet）、RefineNet、全局卷积网络（GCN）和DeepLabv3+相比较，MUNet的参数量以及计算量更少，同时网络分割性能更好。

参考文献 | 相关文章 | 多维度评价

Select

23. 遥感影像变化检测综述

任秋如, 杨文忠, 汪传建, 魏文钰, 钱芸芸

《计算机应用》唯一官方网站 2021, 41 (8): 2294-2305. DOI: 10.11772/j.issn.1001-9081.2020101632

摘要（1011）

PDF （1683KB）（1093）

变化检测作为土地利用/土地覆盖检测的关键技术，其目的是在同一区域不同时期的遥感数据中检测出变化的部分及其类型。针对传统的变化检测方法中存在繁重的人工劳动和检测结果效果差等问题，大量基于遥感影像的变化检测方法被提出。为了深入了解基于遥感影像的变化检测技术以及进一步研究变化检测方法，通过对大量有关变化检测的研究进行整理、分析和比较，对变化检测进行了较为全面的综述。首先阐述了变化检测的发展历程；然后从数据选择及预处理、变化检测技术、后处理及精度评价这三个方面详细归纳了变化检测的研究进展，其中变化检测技术主要从分析单元和比较方法的方面分别进行概括；最后对变化检测各个阶段存在的问题进行了总结并提出了未来的发展方向。

参考文献 | 相关文章 | 多维度评价

Select

24. 动态环境下基于深度学习的语义SLAM算法

郑思诚, 孔令华, 游通飞, 易定容

计算机应用 2021, 41 (10): 2945-2951. DOI: 10.11772/j.issn.1001-9081.2020111885

摘要（445）

PDF （1572KB）（1079）

针对应用场景中存在的运动物体会降低视觉同步定位与地图构建（SLAM）系统的定位精度和鲁棒性的问题，提出一种基于语义信息的动态环境下的视觉SLAM算法。首先，将传统视觉SLAM前端与YOLOv4目标检测算法相结合，在对输入图像进行ORB特征提取的同时，对该图像进行语义分割；然后，判断目标类型以获得动态目标在图像中的区域，剔除分布在动态物体上的特征点；最后，使用处理后的特征点与相邻帧进行帧间匹配来求解相机位姿。实验采用TUM数据集进行测试，测试结果表明，所提算法相较于ORB-SLAM2在高动态环境下在位姿估计精度上提升了96.78%，同时该算法的跟踪线程处理一帧的平均耗时为0.065 5 s，相较于其他应用在动态环境下的SLAM算法耗时最短。实验结果表明，所提算法能够实现在动态环境中的实时精确定位与建图。

参考文献 | 相关文章 | 多维度评价

Select

25. 基于Transformer的U型医学图像分割网络综述

傅励瑶, 尹梦晓, 杨锋

《计算机应用》唯一官方网站 2023, 43 (5): 1584-1595. DOI: 10.11772/j.issn.1001-9081.2022040530

摘要（1473）

HTML （64）

PDF （1887KB）（1073）

目前，医学图像分割模型广泛采用基于全卷积网络（FCN）的U型网络（U-Net）作为骨干网，但卷积神经网络（CNN）在捕捉长距离依赖能力上的劣势限制了分割模型性能的进一步提升。针对上述问题，研究者们将Transformer应用到医学图像分割模型中以弥补CNN的不足，结合Transformer和U型结构的分割网络成为研究热点之一。在详细介绍U-Net和Transformer之后，按医学图像分割模型中Transformer模块所处的位置，包括仅在编码器或解码器、同时在编码器和解码器、作为过渡连接和其他位置进行分类，讨论各模型的基本内容、设计理念以及可改进的地方，并分析了Transformer处于不同位置的优缺点。根据分析结果可知，决定Transformer所在位置的最大因素是目标分割任务的特点，而且Transformer结合U-Net的分割模型能更好地利用CNN和Transformer各自的优势，提高模型的分割性能，具有较大的发展前景和研究价值。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

26. 联邦学习中的隐私保护技术研究综述

王腾, 霍峥, 黄亚鑫, 范艺琳

《计算机应用》唯一官方网站 2023, 43 (2): 437-449. DOI: 10.11772/j.issn.1001-9081.2021122072

摘要（1397）

HTML （133）

PDF （2014KB）（1072）

近年来，联邦学习成为解决机器学习中数据孤岛与隐私泄露问题的新思路。联邦学习架构不需要多方共享数据资源，只要参与方在本地数据上训练局部模型，并周期性地将参数上传至服务器来更新全局模型，就可以获得在大规模全局数据上建立的机器学习模型。联邦学习架构具有数据隐私保护的特质，是未来大规模数据机器学习的新方案。然而，该架构的参数交互方式可能导致数据隐私泄露。目前，研究如何加强联邦学习架构中的隐私保护机制已经成为新的热点。从联邦学习中存在的隐私泄露问题出发，探讨了联邦学习中的攻击模型与敏感信息泄露途径，并重点综述了联邦学习中的几类隐私保护技术：以差分隐私为基础的隐私保护技术、以同态加密为基础的隐私保护技术、以安全多方计算（SMC）为基础的隐私保护技术。最后，探讨了联邦学习中隐私保护中的若干关键问题，并展望了未来研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

27. 基于数据流的加密流量分类方法

郭帅, 苏旸

计算机应用 2021, 41 (5): 1386-1391. DOI: 10.11772/j.issn.1001-9081.2020071073

摘要（528）

PDF （948KB）（1066）

针对当前网络中加密流量的快速分类和准确识别的问题，提出了一种新的数据流特征提取方法。依据序列型数据特点和SSL握手协议规律，采用了端到端的一维卷积神经网络模型，并利用五元组来标记数据流；通过对数据流表示方式、数据包个数和特征字节长度的选择，更准确地定位了样本分类的关键字段位置，去除了对样本分类影响较小的特征，从而把原始输入时单个数据流使用的784字节缩减到529字节，精简了原长度的32%，并且实现了加密流量服务类型的12分类，其准确率达到95.5%。这些结果表明，所提方法可以在保证当前研究准确率的基础上减少原始输入特征维度并提高数据处理的效率。

参考文献 | 相关文章 | 多维度评价

Select

28. 基于改进YOLOv8的嵌入式道路裂缝检测算法

耿焕同刘振宇蒋骏范子辰李嘉兴

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2023050635
预出版日期: 2023-09-01

Select

29. 基于注意力自身线性融合的弱监督细粒度图像分类算法

陆鑫伟, 余鹏飞, 李海燕, 李红松, 丁文谦

计算机应用 2021, 41 (5): 1319-1325. DOI: 10.11772/j.issn.1001-9081.2020071105

摘要（371）

PDF （1945KB）（1042）

随着人工智能的飞速发展，计算机视觉领域对图像的分类任务不仅仅限于识别出物体的大类，更需要对同一类别的图像进行更加细致的子类划分。为了有效区分出类间的微小差异以及减少背景因素的干扰，提出了一种基于AABP的细粒度分类算法。首先，通过Inception V3预训练模型提取全局图像特征，并利用深度可分离卷积在特征映射上预测出局部注意力区域；然后，应用弱监督数据增强网络（WS-DAN）的算法将增强后的图像反馈回网络中，以此加强网络的泛化能力，防止过拟合；最后，将进一步提取的注意力特征区域在AABP网络中进行线性融合，以提升分类的精度。实验结果表明，该算法在数据集CUB-200-2011上达到88.51%的准确率、97.65%的top5准确率，在Stanford Cars数据集上到89.77%的准确率、99.27%的top5准确率，在FGVC-Aircraft数据集上到93.5%的准确率、97.96%的top5准确率。

参考文献 | 相关文章 | 多维度评价

Select

30. 基于人体骨架特征编码的健身动作识别方法

郭天晓, 胡庆锐, 李建伟, 沈燕飞

计算机应用 2021, 41 (5): 1458-1464. DOI: 10.11772/j.issn.1001-9081.2020071113

摘要（719）

PDF （1143KB）（1031）

健身动作识别是智能健身系统的核心环节。为了提高健身动作识别算法的精度和速度，并减少健身动作中人体整体位移对识别结果的影响，提出了一种基于人体骨架特征编码的健身动作识别方法。该方法包括三个步骤：首先，构建精简的人体骨架模型，并利用人体姿态估计技术提取骨架模型中各关节点的坐标信息；其次，利用人体中心投影法提取动作特征区域以消除人体整体位移对动作识别的影响；最后，将特征区域编码作为特征向量并输入多分类器进行动作识别，同时通过优化特征向量长度使识别率和速度达到最优。实验结果表明，本方法在包含28种动作的自建健身数据集上的动作识别率为97.24%，证明该方法能够有效识别各类健身动作；在公开的KTH和Weizmann数据集上，所提方法的动作识别率分别为91.67%和90%，优于其他同类型方法。

参考文献 | 相关文章 | 多维度评价

全文下载排行