综述

Select

1. 知识图谱综述——表示、构建、推理与知识超图理论

田玲, 张谨川, 张晋豪, 周望涛, 周雪

《计算机应用》唯一官方网站 2021, 41 (8): 2161-2186. DOI: 10.11772/j.issn.1001-9081.2021040662

摘要（3283）

PDF （2811KB）（4268）

针对知识图谱（KG）在知识驱动的人工智能研究中发挥的强大支撑作用，分析并总结了现有知识图谱和知识超图技术。首先，从知识图谱的定义与发展历程出发，介绍了知识图谱的分类和架构；其次，对现有的知识表示与存储方式进行了阐述；然后，基于知识图谱的构建流程，分析了各类知识图谱构建技术的研究现状。特别是针对知识图谱中的知识推理这一重要环节，分析了基于逻辑规则、嵌入表示和神经网络的三类典型的知识推理方法。此外，以异构超图引出知识超图的研究进展，并提出三层架构的知识超图，从而更好地表示和提取超关系特征，实现对超关系数据的建模及快速的知识推理。最后，总结了知识图谱和知识超图的典型应用场景并对未来的研究作出了展望。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于深度学习的事件因果关系抽取综述

王朱君, 王石, 李雪晴, 朱俊武

《计算机应用》唯一官方网站 2021, 41 (5): 1247-1255. DOI: 10.11772/j.issn.1001-9081.2020071080

摘要（3091）

PDF （1460KB）（4064）

因果关系抽取是自然语言处理（NLP）中的一种关系抽取任务，它通过构造事件图来挖掘文本中具有因果关系的事件对，已经在金融、安全、生物等领域的应用中发挥重要作用。首先，介绍了事件抽取和因果关系等概念，并介绍了因果关系抽取主流方法的演变和常用数据集；然后，列举了当前主流的因果关系抽取模型，并且在分别对基于流水线的模型和联合抽取模型进行详细分析的基础上，对比了各种方法和模型的优缺点；此外，对各模型的实验性能及相关实验数据进行了归纳分析；最后，给出了当前的因果关系抽取的研究难点和未来的重点研究方向。

参考文献 | 相关文章 | 多维度评价

Select

3. 联邦学习综述：概念、技术、应用与挑战

梁天恺, 曾碧, 陈光

《计算机应用》唯一官方网站 2022, 42 (12): 3651-3662. DOI: 10.11772/j.issn.1001-9081.2021101821

摘要（3000）

HTML （205）

PDF （2464KB）（2216）

在强调数据确权以及隐私保护的时代背景下，联邦学习作为一种新的机器学习范式，能够在不暴露各方数据的前提下达到解决数据孤岛以及隐私保护问题的目的。目前，基于联邦学习的建模方法已成为主流并且获得了很好的效果，因此对联邦学习的概念、技术、应用和挑战进行总结与分析具有重要的意义。首先，阐述了机器学习的发展历程以及联邦学习出现的必然性，并给出联邦学习的定义与分类；其次，介绍并分析了目前业界认可的三种联邦学习方法：横向联邦学习、纵向联邦学习和联邦迁移学习；然后，针对联邦学习的隐私保护问题，归纳并总结了目前常见的隐私保护技术；此外，还对联邦学习的现有主流开源框架进行了介绍与对比，同时给出了联邦学习的应用场景；最后，展望了联邦学习所面临的挑战和未来的研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 自然语言生成综述

李雪晴, 王石, 王朱君, 朱俊武

《计算机应用》唯一官方网站 2021, 41 (5): 1227-1235. DOI: 10.11772/j.issn.1001-9081.2020071069

摘要（2790）

PDF （1165KB）（3914）

自然语言生成（NLG）技术利用人工智能和语言学的方法来自动地生成可理解的自然语言文本。NLG降低了人类和计算机之间沟通的难度，被广泛应用于机器新闻写作、聊天机器人等领域，已经成为人工智能的研究热点之一。首先，列举了当前主流的NLG的方法和模型，并详细对比了这些方法和模型的优缺点；然后，分别针对文本到文本、数据到文本和图像到文本等三种NLG技术，总结并分析了应用领域、存在的问题和当前的研究进展；进而，阐述了上述生成技术的常用评价方法及其适用范围；最后，给出了当前NLG技术的发展趋势和研究难点。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于深度学习的图像边缘检测算法综述

李翠锦, 瞿中

《计算机应用》唯一官方网站 2020, 40 (11): 3280-3288. DOI: 10.11772/j.issn.1001-9081.2020030314

摘要（2703）

PDF （922KB）（4057）

边缘检测是将图像中的突变的重要信息提取出来的过程，是计算机视觉领域研究热点，也是图像分割、目标检测与识别等多种中高层视觉任务的基础。近几年来，针对边缘轮廓线过粗以及检测精度不高等问题，业内提出了谱聚类、多尺度融合、跨层融合等基于深度学习的边缘检测算法。为了使更多研究者了解边缘检测的研究现状，首先，介绍了传统边缘检测的实现理论及方法；然后，总结了近年来基于深度学习的主要边缘检测方法，并依据实现技术对这些方法进行了分类，对其涉及的关键技术进行分析，发现对多尺度多层次融合与损失函数的选择是重要的研究方向。通过评价指标对各类方法进行了比较，可知边缘检测算法在伯克利大学数据集（BSDS500）上的最优数据集规模（ODS）经过多年研究从0.598提高到了0.828，接近人类视觉水平。最后，展示了边缘检测算法研究的发展方向。

参考文献 | 相关文章 | 多维度评价

Select

6. 推荐系统综述

于蒙, 何文涛, 周绪川, 崔梦天, 吴克奇, 周文杰

《计算机应用》唯一官方网站 2022, 42 (6): 1898-1913. DOI: 10.11772/j.issn.1001-9081.2021040607

摘要（2175）

HTML （202）

PDF （3152KB）（1755）

随着网络应用的不断发展，网络资源呈指数型增长，信息过载现象日益严重，如何高效获取符合需求的资源成为困扰人们的问题之一。推荐系统能对海量信息进行有效过滤，为用户推荐符合其需求的资源。对推荐系统的研究现状进行详细介绍，包括基于内容的推荐、协同过滤推荐和混合推荐这三种传统推荐方式，并重点分析了基于卷积神经网络（CNN）、深度神经网络（DNN）、循环神经网络（RNN）和图神经网络（GNN）这四种常见的深度学习推荐模型的研究进展；归纳整理了推荐领域常用的数据集，同时分析对比了传统推荐算法和基于深度学习的推荐算法的差异。最后，总结了实际应用中具有代表性的推荐模型，讨论了推荐系统面临的挑战和未来的研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 基于深度学习的医学影像分割研究综述

曹玉红, 徐海, 刘荪傲, 王紫霄, 李宏亮

《计算机应用》唯一官方网站 2021, 41 (8): 2273-2287. DOI: 10.11772/j.issn.1001-9081.2020101638

摘要（2068）

PDF （2539KB）（1686）

医学影像分割是计算机辅助诊断中的一项基础且关键的任务，目的在于从像素级别准确识别出目标器官、组织或病变区域。不同于自然场景下的图像，医学影像往往纹理复杂，同时受限于成像技术和成像设备，医学影像噪声大，边界模糊而不易判断。除此之外，对医学影像进行标注极大依赖于医疗专家的认知和经验，因此可用于训练中的标注数据少且存在标注误差。由于上述的医学影像边缘模糊不清、训练数据较少和标注误差较大等特点，基于传统图像分割算法搭建的辅助诊断系统难以满足临床应用的要求。近年来随着卷积神经网络（CNN）在计算机视觉和自然语言处理领域的广泛应用，基于深度学习的医学影像分割算法取得了极大的成功。首先概述了近几年基于深度学习的医学影像分割的研究进展，包括这些医学影像分割算法的基本结构、目标函数和优化方法。随后针对医学影像标注数据有限的问题，对目前半监督条件下医学影像分割的主流工作进行了整理归纳和分析。此外，还介绍了针对标注误差进行不确定度分析的相关工作。最后，总结分析了深度学习医学影像分割的特点并展望了未来的研究趋势。

参考文献 | 相关文章 | 多维度评价

Select

8. 联邦学习通信开销研究综述

邱鑫源, 叶泽聪, 崔翛龙, 高志强

《计算机应用》唯一官方网站 2022, 42 (2): 333-342. DOI: 10.11772/j.issn.1001-9081.2021020232

摘要（1988）

HTML （305）

PDF （1356KB）（2556）

为了解决数据共享需求与隐私保护要求之间不可调和的矛盾，联邦学习应运而生。联邦学习作为一种分布式机器学习，其中的参与方与中央服务器之间需要不断交换大量模型参数，而这造成了较大通信开销；同时，联邦学习越来越多地部署在通信带宽有限、电量有限的移动设备上，而有限的网络带宽和激增的客户端数量会使通信瓶颈加剧。针对联邦学习的通信瓶颈问题，首先分析联邦学习的基本工作流程；然后从方法论的角度出发，详细介绍基于降低模型更新频率、模型压缩、客户端选择的三类主流方法和模型划分等特殊方法，并对具体优化方案进行深入的对比分析；最后，对联邦学习通信开销技术研究的发展趋势进行了总结和展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

9. 基于深度学习的多模态医学图像分割综述

窦猛, 陈哲彬, 王辛, 周继陶, 姚宇

《计算机应用》唯一官方网站 2023, 43 (11): 3385-3395. DOI: 10.11772/j.issn.1001-9081.2022101636

摘要（1884）

HTML （93）

PDF （3904KB）（2386）

多模态医学图像可以为临床医生提供靶区（如肿瘤、器官或组织）的丰富信息。然而，由于多模态图像之间相互独立且仅有互补性，如何有效融合多模态图像并进行分割仍是亟待解决的问题。传统的图像融合方法难以有效解决此问题，因此基于深度学习的多模态医学图像分割算法得到了广泛的研究。从原理、技术、问题及展望等方面对基于深度学习的多模态医学图像分割任务进行了综述。首先，介绍了深度学习与多模态医学图像分割的一般理论，包括深度学习与卷积神经网络（CNN）的基本原理与发展历程，以及多模态医学图像分割任务的重要性；其次，介绍了多模态医学图像分割的关键概念，包括数据维度、预处理、数据增强、损失函数以及后处理等；接着，对基于不同融合策略的多模态分割网络进行综述，对不同方式的融合策略进行分析；最后，对医学图像分割过程中常见的几个问题进行探讨，并对今后研究作了总结与展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

10. 联邦学习中的隐私保护技术研究综述

王腾, 霍峥, 黄亚鑫, 范艺琳

《计算机应用》唯一官方网站 2023, 43 (2): 437-449. DOI: 10.11772/j.issn.1001-9081.2021122072

摘要（1745）

HTML （165）

PDF （2014KB）（1296）

近年来，联邦学习成为解决机器学习中数据孤岛与隐私泄露问题的新思路。联邦学习架构不需要多方共享数据资源，只要参与方在本地数据上训练局部模型，并周期性地将参数上传至服务器来更新全局模型，就可以获得在大规模全局数据上建立的机器学习模型。联邦学习架构具有数据隐私保护的特质，是未来大规模数据机器学习的新方案。然而，该架构的参数交互方式可能导致数据隐私泄露。目前，研究如何加强联邦学习架构中的隐私保护机制已经成为新的热点。从联邦学习中存在的隐私泄露问题出发，探讨了联邦学习中的攻击模型与敏感信息泄露途径，并重点综述了联邦学习中的几类隐私保护技术：以差分隐私为基础的隐私保护技术、以同态加密为基础的隐私保护技术、以安全多方计算（SMC）为基础的隐私保护技术。最后，探讨了联邦学习中隐私保护中的若干关键问题，并展望了未来研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

11. 多模态预训练模型综述

王惠茹, 李秀红, 李哲, 马春明, 任泽裕, 杨丹

《计算机应用》唯一官方网站 2023, 43 (4): 991-1004. DOI: 10.11772/j.issn.1001-9081.2022020296

摘要（1738）

HTML （149）

PDF （5539KB）（1404）

PDF（mobile）（3280KB）（111）

预训练模型（PTM）通过利用复杂的预训练目标和大量的模型参数，可以有效地获得无标记数据中的丰富知识。而在多模态中，PTM的发展还处于初期。根据具体模态的不同，将目前大多数的多模态PTM分为图像?文本PTM和视频?文本PTM；根据数据融合方式的不同，还可将多模态PTM分为单流模型和双流模型两类。首先，总结了常见的预训练任务和验证实验所使用的下游任务；接着，梳理了目前多模态预训练领域的常见模型，并用表格列出各个模型的下游任务以及模型的性能和实验数据比较；然后，介绍了M6（Multi-Modality to Multi-Modality Multitask Mega-transformer）模型、跨模态提示调优（CPT）模型、VideoBERT（Video Bidirectional Encoder Representations from Transformers）模型和AliceMind（Alibaba’s collection of encoder-decoders from Mind）模型在具体下游任务中的应用场景；最后，总结了多模态PTM相关工作面临的挑战以及未来可能的研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

12. 基于Transformer的U型医学图像分割网络综述

傅励瑶, 尹梦晓, 杨锋

《计算机应用》唯一官方网站 2023, 43 (5): 1584-1595. DOI: 10.11772/j.issn.1001-9081.2022040530

摘要（1704）

HTML （85）

PDF （1887KB）（1179）

目前，医学图像分割模型广泛采用基于全卷积网络（FCN）的U型网络（U-Net）作为骨干网，但卷积神经网络（CNN）在捕捉长距离依赖能力上的劣势限制了分割模型性能的进一步提升。针对上述问题，研究者们将Transformer应用到医学图像分割模型中以弥补CNN的不足，结合Transformer和U型结构的分割网络成为研究热点之一。在详细介绍U-Net和Transformer之后，按医学图像分割模型中Transformer模块所处的位置，包括仅在编码器或解码器、同时在编码器和解码器、作为过渡连接和其他位置进行分类，讨论各模型的基本内容、设计理念以及可改进的地方，并分析了Transformer处于不同位置的优缺点。根据分析结果可知，决定Transformer所在位置的最大因素是目标分割任务的特点，而且Transformer结合U-Net的分割模型能更好地利用CNN和Transformer各自的优势，提高模型的分割性能，具有较大的发展前景和研究价值。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

13. 深度学习可解释性研究综述

雷霞, 罗雄麟

《计算机应用》唯一官方网站 2022, 42 (11): 3588-3602. DOI: 10.11772/j.issn.1001-9081.2021122118

摘要（1640）

HTML （94）

PDF （1703KB）（1283）

随着深度学习的广泛应用，人类越来越依赖于大量采用深度学习技术的复杂系统，然而，深度学习模型的黑盒特性对其在关键任务应用中的使用提出了挑战，引发了道德和法律方面的担忧，因此，使深度学习模型具有可解释性是使它们令人信服首先要解决的问题。于是，关于可解释的人工智能领域的研究应运而生，主要集中于向人类观察者明确解释模型的决策或行为。对深度学习可解释性的研究现状进行综述，为进一步深入研究建立更高效且具有可解释性的深度学习模型确立良好的基础。首先，对深度学习可解释性进行了概述，阐明可解释性研究的需求和定义；然后，从解释深度学习模型的逻辑规则、决策归因和内部结构表示这三个方面出发介绍了几种可解释性研究的典型模型和算法，另外还指出了三种常见的内置可解释模型的构建方法；最后，简单介绍了忠实度、准确性、鲁棒性和可理解性这四种评价指标，并讨论了深度学习可解释性未来可能的发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

14. 深度学习在天气预报领域的应用分析及研究进展综述

董润婷, 吴利, 王晓英, 曹腾飞, 黄建强, 管琴, 吴洁瑕

《计算机应用》唯一官方网站 2023, 43 (6): 1958-1968. DOI: 10.11772/j.issn.1001-9081.2022050745

摘要（1606）

HTML （134）

PDF （1570KB）（3970）

随着传感器网络和全球定位系统等技术的进步，兼有时间与空间特性的气象数据体量呈爆炸式增长，针对时空序列预测（STSF）的深度学习模型研究得到了迅猛发展。然而，长期以来用于天气预报的传统机器学习方法在提取数据的时间相关性与空间依赖性方面的效果往往并不理想。与此同时，深度学习方法通过人工神经网络自动提取特征，可以有效提高天气预报的准确度，并且在编码长期空间信息的建模方面有相当优秀的效果。同时，由观测数据驱动的深度学习模型与基于物理理论的数值天气预报（NWP）模型结合的方式可以构建拥有更高预测精度与更长预报时间的混合模型。基于这些，将深度学习在天气预报领域的应用分析及研究进展进行了综述。首先，将天气预报领域的深度学习问题与经典深度学习问题从数据格式、问题模型与评价指标这3个方面进行了对比研究；然后，回顾了深度学习在天气预报领域的发展历程与应用现状，并总结分析了深度学习技术与NWP结合的最新进展；最后，展望了未来的发展方向和研究重点，为天气预报领域的深度学习研究提供参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

15. 门罗币匿名及追踪技术综述

林定康, 颜嘉麒, 巴楠登, 符朕皓, 姜皓晨

《计算机应用》唯一官方网站 2022, 42 (1): 148-156. DOI: 10.11772/j.issn.1001-9081.2021020296

摘要（1595）

HTML （78）

PDF （723KB）（778）

虚拟数字货币为恐怖分子融资、洗钱、毒品交易等犯罪活动提供了温床，而门罗币作为新兴数字货币的代表，具有公认的高匿名性。针对利用门罗币匿名性犯罪的问题，从技术角度探索门罗币匿名技术及其追踪技术，综述近年来的研究进展，从而为有效应对基于区块链技术的犯罪提供技术支持。具体来说，总结了门罗币匿名技术的演进，并梳理了学术界关于门罗币匿名技术的追溯对策。首先，在匿名技术中，介绍了环签名、保证不可链接性（一次性公钥）、保证不可追溯性、提高匿名性的重要版本升级等。然后，在追踪技术中，介绍了0-mixin攻击、输出合并攻击、最新猜测攻击、封闭集攻击、泛洪攻击、恶意远程节点攻击、钱包环攻击等攻击方法。最后，基于对匿名技术和追溯对策的分析，得出了四点结论：门罗币的匿名技术和追踪技术的发展相互促进；RingCT的应用是一把双刃剑，既使得从币值出发的被动攻击方法失效，也使得主动攻击方法更加容易奏效；输出合并攻击和0-mixin攻击具有互补作用；门罗币的系统安全链条仍待理顺。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

16. 多维时间序列异常检测算法综述

胡珉, 白雪, 徐伟, 吴秉键

《计算机应用》唯一官方网站 2020, 40 (6): 1553-1564. DOI: 10.11772/j.issn.1001-9081.2019101805

摘要（1567）

PDF （930KB）（3751）

随着信息化技术不断提高，时序数据规模呈指数级增长，为时间序列异常检测算法发展提供了契机和挑战，也使其逐步成为数据分析领域新增的研究热点。然而，这一方面的研究仍处于初步阶段，研究工作的系统性不强。为此，通过整理和分析国内外文献，将多维时间序列异常检测的研究内容按照逻辑顺序分为“维数约简”“时间序列模式表示”和“异常模式发现”三个方面，并对其主流算法进行梳理和归纳，以全面展现当前异常检测的研究现状和特点。在此基础上，还指出了多维时间序列异常检测算法的研究难点和研究趋势，以期对相关理论和应用研究提供有益的参考。

参考文献 | 相关文章 | 多维度评价

Select

17. 面向物联网的区块链共识机制综述

田志宏, 赵金东

《计算机应用》唯一官方网站 2021, 41 (4): 917-929. DOI: 10.11772/j.issn.1001-9081.2020111722

摘要（1550）

PDF （1143KB）（2314）

随着数字货币的不断发展，区块链技术引起越来越多人的关注，而对其关键技术共识机制的研究尤为重要。将区块链技术应用在物联网（IoT）中是目前研究的热点问题之一。共识机制是区块链的核心技术之一，其在去中心化程度、交易处理速度、交易确认延迟、安全性以及可扩展性等方面对IoT产生了重要影响。首先对IoT的体系结构特征以及资源受限问题造成的轻量化问题作了阐述，对在IoT中实现区块链所面临的问题作了简要概述，并结合比特币的运行流程对IoT中的区块链需求进行了分析；其次，把共识机制分为证明类、拜占庭类和有向无环图（DAG）类，研究了这些不同类别的共识机制的工作原理，在通信复杂度上分析它们与IoT的适应度，总结它们的优缺点，并对现有的共识机制和IoT结合的架构进行了调研分析；最后，针对IoT面临的中心机构运行成本高、可扩展性差、安全性存在隐患等问题进行了深入研究，分析结果表明，基于DAG技术的埃欧塔（IOTA）和Byteball共识机制在交易数量很多的情况下具有交易处理速度快、可扩展性好、安全性强的优点，是未来IoT领域区块链共识机制的发展方向。

参考文献 | 相关文章 | 多维度评价

Select

18. 基于深度学习的行人重识别综述

杨锋, 许玉, 尹梦晓, 符嘉成, 黄冰, 梁芳烜

计算机应用 2020, 40 (5): 1243-1252. DOI: 10.11772/j.issn.1001-9081.2019091703

摘要（1304）

PDF （1156KB）（1394）

行人重识别(Re-ID)是计算机视觉领域的热点问题，主要研究的是“如何关联位于不同物理位置的不同摄像机捕获到的特定人员的问题”。传统的行人Re-ID方法主要基于底层特征如局部描述符、颜色直方图和人体姿势的提取。近几年，针对行人遮挡和姿势不对齐等传统方法所遗留问题，业内提出了基于区域、注意力机制、姿势和生成对抗性网络(GAN)等深度学习的行人Re-ID方法，实验结果得到较明显的提高。故对深度学习在行人Re-ID中的研究进行了总结和分类，区别于以前的综述，将行人重识别方法分成四大类来讨论。首先,通过区域、注意力、姿势和GAN四类方法来综述基于深度学习的行人Re-ID方法;然后,分析这些方法在主流数据集上的mAP和Rank-1指标性能表现，结果显示基于深度学习的方法可以增强局部特征之间的联系并缩小域间隙，从而减少模型过拟合;最后,展望了行人Re-ID方法研究的发展方向。

参考文献 | 相关文章 | 多维度评价

Select

19. 解耦表征学习研究进展

成科扬, 孟春运, 王文杉, 师文喜, 詹永照

《计算机应用》唯一官方网站 2021, 41 (12): 3409-3418. DOI: 10.11772/j.issn.1001-9081.2021060895

摘要（1255）

HTML （151）

PDF （877KB）（573）

解耦表征学习旨在对影响数据形态的关键因素进行建模，使得某一关键因素的变化仅仅引起数据在某项特征上的变化，而其他的特征不受影响，这有利于应对机器学习在模型可解释性、对象生成和操作以及零样本学习等问题上的挑战，因此解耦表征学习一直是机器学习领域的一个研究热点。从解耦表征学习的历史与动机入手，对解耦表征学习的研究现状以及应用进行归纳总结，分析了解耦表征所具有的不变性、复用性等特性，介绍了基于生成解耦表征变差因素的研究、基于流形相互作用解耦表征变差因素的研究、基于对抗性训练解耦表征变差因素的研究，以及一种变分自编码器β-VAE的研究等最新研究动态。同时，阐述了解耦表征学习的典型应用，并对未来的研究方向作出了展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

20. 细粒度图像分类综述

申志军, 穆丽娜, 高静, 史远航, 刘志强

《计算机应用》唯一官方网站 2023, 43 (1): 51-60. DOI: 10.11772/j.issn.1001-9081.2021122090

摘要（1205）

HTML （64）

PDF （2674KB）（692）

细粒度图像具有类内方差大、类间方差小的特点，致使细粒度图像分类（FGIC）的难度远高于传统的图像分类任务。介绍了FGIC的应用场景、任务难点、算法发展历程和相关的常用数据集，主要概述相关算法：基于局部检测的分类方法通常采用连接、求和及池化等操作，模型训练较为复杂，在实际应用中存在较多局限；基于线性特征的分类方法模仿人类视觉的两个神经通路分别进行识别和定位，分类效果相对较优；基于注意力机制的分类方法模拟人类观察外界事物的机制，先扫描全景，后锁定重点关注区域并形成注意力焦点，分类效果有进一步的提高。最后针对目前研究的不足，展望FGIC下一步的研究方向。

参考文献 | 相关文章 | 多维度评价

Select

21. 遥感影像变化检测综述

任秋如, 杨文忠, 汪传建, 魏文钰, 钱芸芸

《计算机应用》唯一官方网站 2021, 41 (8): 2294-2305. DOI: 10.11772/j.issn.1001-9081.2020101632

摘要（1191）

PDF （1683KB）（1688）

变化检测作为土地利用/土地覆盖检测的关键技术，其目的是在同一区域不同时期的遥感数据中检测出变化的部分及其类型。针对传统的变化检测方法中存在繁重的人工劳动和检测结果效果差等问题，大量基于遥感影像的变化检测方法被提出。为了深入了解基于遥感影像的变化检测技术以及进一步研究变化检测方法，通过对大量有关变化检测的研究进行整理、分析和比较，对变化检测进行了较为全面的综述。首先阐述了变化检测的发展历程；然后从数据选择及预处理、变化检测技术、后处理及精度评价这三个方面详细归纳了变化检测的研究进展，其中变化检测技术主要从分析单元和比较方法的方面分别进行概括；最后对变化检测各个阶段存在的问题进行了总结并提出了未来的发展方向。

参考文献 | 相关文章 | 多维度评价

Select

22. 时空轨迹序列模式挖掘方法综述

康军, 黄山, 段宗涛, 李宜修

《计算机应用》唯一官方网站 2021, 41 (8): 2379-2385. DOI: 10.11772/j.issn.1001-9081.2020101571

摘要（1103）

PDF （1204KB）（1623）

在全球定位、移动通信技术迅速发展的背景下涌现出了海量的时空轨迹数据，这些数据是对移动对象在时空环境下的移动模式和行为特征的真实写照，蕴含了丰富的信息，这些信息对于城市规划、交通管理、服务推荐、位置预测等领域具有重要的应用价值，而时空轨迹数据在这些领域的应用通常需要通过对时空轨迹数据进行序列模式挖掘才能得以实现。时空轨迹序列模式挖掘旨在从时空轨迹数据集中找出频繁出现的序列模式，例如：位置模式（频繁轨迹、热点区域）、活动周期模式、语义行为模式，从而挖掘时空数据中隐藏的信息。总结近年来时空轨迹序列模式挖掘的研究进展，先介绍时空轨迹序列的数据特点及应用，再描述时空轨迹模式的挖掘过程：从基于时空轨迹序列来挖掘位置模式、周期模式、语义模式这三个方面来介绍该领域的研究情况，最后阐述现有时空轨迹序列模式挖掘方法存在的问题，并展望时空轨迹序列模式挖掘方法未来的发展趋势。

参考文献 | 相关文章 | 多维度评价

Select

23. 深度学习的可解释性研究综述

李凌敏, 侯梦然, 陈琨, 刘军民

《计算机应用》唯一官方网站 2022, 42 (12): 3639-3650. DOI: 10.11772/j.issn.1001-9081.2021091649

摘要（1097）

HTML （78）

PDF （4239KB）（733）

近年来，深度学习在很多领域得到广泛应用；然而，由于深度神经网络模型的高度非线性操作，导致其可解释性较差，并常常被称为“黑箱”模型，无法应用于一些对性能要求较高的关键领域；因此，对深度学习的可解释性开展研究是很有必要的。首先，简单介绍了深度学习；然后，围绕深度学习的可解释性，从隐层可视化、类激活映射（CAM）、敏感性分析、频率原理、鲁棒性扰动测试、信息论、可解释模块和优化方法这8个方面对现有研究工作进行分析；同时，展示了深度学习在网络安全、推荐系统、医疗和社交网络领域的应用；最后，讨论了深度学习可解释性研究存在的问题及未来的发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

24. 基于深度学习的标签噪声学习算法综述

伏博毅, 彭云聪, 蓝鑫, 秦小林

《计算机应用》唯一官方网站 2023, 43 (3): 674-684. DOI: 10.11772/j.issn.1001-9081.2022020198

摘要（1091）

HTML （83）

PDF （2083KB）（766）

PDF（mobile）（733KB）（49）

在深度学习领域中，大量正确标注的样本对于模型的训练和学习至关重要。然而，在实际的应用场景中，标注数据的成本很高，同时标注的样本质量会受人工标注的主观因素或工具技术的影响，在标注过程中无法避免标签噪声的产生。因此，现有的训练数据都存在一定的标签噪声，如何有效地训练带标签噪声的训练数据成为了研究的热点。围绕基于深度学习的标签噪声学习算法，首先详细阐述了标签噪声学习问题的来源、分类和影响；然后依照机器学习的不同要素分析了基于数据、损失函数、模型、训练方式的四种标签噪声学习策略；随后提供了各种应用场景下学习标签噪声问题的基础框架；最后，给出一些优化思路，并展望了标签噪声学习算法面临的挑战与未来的发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

25. 基于孪生网络的单目标跟踪算法综述

王梦亭, 杨文忠, 武雍智

《计算机应用》唯一官方网站 2023, 43 (3): 661-673. DOI: 10.11772/j.issn.1001-9081.2022010150

摘要（1072）

HTML （132）

PDF （2647KB）（785）

单目标跟踪是计算机视觉领域的一个重要研究方向，在视频监控、自动驾驶等领域应用广泛。对于单目标跟踪算法，尽管已有大量总结研究，但大多基于相关滤波或深度学习。近年来，基于孪生网络的跟踪算法因在精度和速度之间取得的平衡受到研究者们的广泛关注，然而目前对该类型算法的总结分析相对较少，并且对这些算法的架构层面缺少系统分析。为深入了解基于孪生网络的单目标跟踪算法，对大量相关文献进行了总结与分析。首先阐述孪生网络的结构和应用，并根据孪生跟踪算法架构组成的分类介绍了各跟踪算法；然后列举单目标跟踪领域常用的数据集和评价指标，对25个主流跟踪算法在OTB2015数据集上分别进行整体和各属性的性能比较与分析，并列出23个孪生跟踪算法在LaSOT和GOT-10K测试集上的性能以及推理时的速度；最后对基于孪生网络的目标跟踪算法的研究进行总结，并对未来的发展方向进行展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

26. 事件抽取综述

马春明, 李秀红, 李哲, 王惠茹, 杨丹

《计算机应用》唯一官方网站 2022, 42 (10): 2975-2989. DOI: 10.11772/j.issn.1001-9081.2021081542

摘要（1058）

HTML （149）

PDF （3054KB）（607）

将用户感兴趣的事件从非结构化信息中提取出来，然后以结构化的方式展示给用户，这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发，事件抽取算法可以分为基于模式匹配的算法、触发词法、基于本体的算法以及前沿联合模型方法这四类。在研究过程中根据相关需求可使用不同评价方法和数据集，而不同的事件表示方法也与事件抽取研究有一定联系；以任务类型区分，元事件抽取和主题事件抽取是事件抽取的两大基本任务。其中，元事件抽取有基于模式匹配、基于机器学习和基于神经网络这三种方式，而主题事件抽取有基于事件框架和基于本体两种方式。事件抽取研究在中英等单语言上均已取得了优秀成果，而跨语言事件抽取依然面临着许多问题。最后，总结了事件抽取的相关工作并提出未来研究方向，以期为后续研究提供参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

27. 面向自然语言处理任务的预训练模型综述

刘睿珩, 叶霞, 岳增营

《计算机应用》唯一官方网站 2021, 41 (5): 1236-1246. DOI: 10.11772/j.issn.1001-9081.2020081152

摘要（1029）

PDF （1296KB）（3225）

近年来，深度学习技术得到了快速发展。在自然语言处理（NLP）任务中，随着文本表征技术从词级上升到了文档级，利用大规模语料库进行无监督预训练的方式已被证明能够有效提高模型在下游任务中的性能。首先，根据文本特征提取技术的发展，从词级和文档级对典型的模型进行了分析；其次，从预训练目标任务和下游应用两个阶段，分析了当前预训练模型的研究现状，并对代表性的模型特点进行了梳理和归纳；最后，总结了当前预训练模型发展所面临的主要挑战并提出了对未来的展望。

参考文献 | 相关文章 | 多维度评价

Select

28. YOLO算法及其在自动驾驶场景中目标检测综述

邓亚平, 李迎江

《计算机应用》唯一官方网站 2024, 44 (6): 1949-1958. DOI: 10.11772/j.issn.1001-9081.2023060889

摘要（1014）

HTML （42）

PDF （1175KB）（882）

自动驾驶场景下的目标检测是计算机视觉中重要研究方向之一，确保自动驾驶汽车对物体进行实时准确的目标检测是研究重点。近年来，深度学习技术迅速发展并被广泛应用于自动驾驶领域中，极大促进了自动驾驶领域的进步。为此，针对YOLO（You Only Look Once）算法在自动驾驶领域中的目标检测研究现状，从以下4个方面分析。首先，总结单阶段YOLO系列检测算法思想及其改进方法，分析YOLO系列算法的优缺点；其次，论述YOLO算法在自动驾驶场景下目标检测中的应用，从交通车辆、行人和交通信号识别这3个方面分别阐述和总结研究现状及应用情况；此外，总结目标检测中常用的评价指标、目标检测数据集和自动驾驶场景数据集；最后，展望目标检测存在的问题和未来发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

29. 不平衡多分类算法综述

李蒙蒙, 刘艺, 李庚松, 郑奇斌, 秦伟, 任小广

《计算机应用》唯一官方网站 2022, 42 (11): 3307-3321. DOI: 10.11772/j.issn.1001-9081.2021122060

摘要（1001）

HTML （99）

PDF （1861KB）（646）

不平衡数据分类是机器学习领域的重要研究内容，但现有的不平衡分类算法通常针对不平衡二分类问题，关于不平衡多分类的研究相对较少。然而实际应用中的数据集通常具有多类别且数据分布具有不平衡性，而类别的多样性进一步加剧了不平衡数据的分类难度，因此不平衡多分类问题已经成为亟待解决的研究课题。针对近年来提出的不平衡多分类算法展开综述，根据是否采用分解策略把不平衡多分类算法分为分解方法和即席方法，并进一步将分解方法按照分解策略的不同划分为“一对一（OVO）”架构和“一对多（OVA）”架构，将即席方法按照处理技术的不同分为数据级方法、算法级方法、代价敏感方法、集成方法和基于深度网络的方法。系统阐述各类方法的优缺点及其代表性算法，总结概括不平衡多分类方法的评价指标，并通过实验深入分析代表性方法的性能，讨论了不平衡多分类的未来发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

30. 基于图文融合的情感分析研究综述

孟祥瑞, 杨文忠, 王婷

《计算机应用》唯一官方网站 2021, 41 (2): 307-317. DOI: 10.11772/j.issn.1001-9081.2020060923

摘要（934）

PDF （1277KB）（1825）

随着信息化技术的不断提升，各类社交平台上带有倾向性的图文数据量快速增长，图文融合的情感分析受到广泛关注，单一的情感分析方法不再能够满足多模态数据的需求。针对图文情感特征提取与融合的技术难题，首先，列举了目前应用较广的图文情感分析数据集，介绍了文本特征和图片特征的提取方式；然后，重点研究了当前图文特征融合方式，简述了在图文情感分析过程中存在的问题；最后，针对未来情感分析的研究方向进行了总结与展望。为深入了解图文融合技术，采用文献调研方法对图文情感分析的研究进行综述，有助于比较不同融合方法之间的区别，发现更具价值的研究方案。

参考文献 | 相关文章 | 多维度评价

虚拟专题文章