虚拟专题文章

    人工智能

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 知识图谱综述——表示、构建、推理与知识超图理论
    田玲, 张谨川, 张晋豪, 周望涛, 周雪
    《计算机应用》唯一官方网站    2021, 41 (8): 2161-2186.   DOI: 10.11772/j.issn.1001-9081.2021040662
    摘要2793)      PDF (2811KB)(3689)    收藏
    针对知识图谱(KG)在知识驱动的人工智能研究中发挥的强大支撑作用,分析并总结了现有知识图谱和知识超图技术。首先,从知识图谱的定义与发展历程出发,介绍了知识图谱的分类和架构;其次,对现有的知识表示与存储方式进行了阐述;然后,基于知识图谱的构建流程,分析了各类知识图谱构建技术的研究现状。特别是针对知识图谱中的知识推理这一重要环节,分析了基于逻辑规则、嵌入表示和神经网络的三类典型的知识推理方法。此外,以异构超图引出知识超图的研究进展,并提出三层架构的知识超图,从而更好地表示和提取超关系特征,实现对超关系数据的建模及快速的知识推理。最后,总结了知识图谱和知识超图的典型应用场景并对未来的研究作出了展望。
    参考文献 | 相关文章 | 多维度评价
    2. 基于深度学习的事件因果关系抽取综述
    王朱君, 王石, 李雪晴, 朱俊武
    《计算机应用》唯一官方网站    2021, 41 (5): 1247-1255.   DOI: 10.11772/j.issn.1001-9081.2020071080
    摘要2789)      PDF (1460KB)(3285)    收藏
    因果关系抽取是自然语言处理(NLP)中的一种关系抽取任务,它通过构造事件图来挖掘文本中具有因果关系的事件对,已经在金融、安全、生物等领域的应用中发挥重要作用。首先,介绍了事件抽取和因果关系等概念,并介绍了因果关系抽取主流方法的演变和常用数据集;然后,列举了当前主流的因果关系抽取模型,并且在分别对基于流水线的模型和联合抽取模型进行详细分析的基础上,对比了各种方法和模型的优缺点;此外,对各模型的实验性能及相关实验数据进行了归纳分析;最后,给出了当前的因果关系抽取的研究难点和未来的重点研究方向。
    参考文献 | 相关文章 | 多维度评价
    3. 自然语言生成综述
    李雪晴, 王石, 王朱君, 朱俊武
    《计算机应用》唯一官方网站    2021, 41 (5): 1227-1235.   DOI: 10.11772/j.issn.1001-9081.2020071069
    摘要2612)      PDF (1165KB)(3660)    收藏
    自然语言生成(NLG)技术利用人工智能和语言学的方法来自动地生成可理解的自然语言文本。NLG降低了人类和计算机之间沟通的难度,被广泛应用于机器新闻写作、聊天机器人等领域,已经成为人工智能的研究热点之一。首先,列举了当前主流的NLG的方法和模型,并详细对比了这些方法和模型的优缺点;然后,分别针对文本到文本、数据到文本和图像到文本等三种NLG技术,总结并分析了应用领域、存在的问题和当前的研究进展;进而,阐述了上述生成技术的常用评价方法及其适用范围;最后,给出了当前NLG技术的发展趋势和研究难点。
    参考文献 | 相关文章 | 多维度评价
    4. 联邦学习综述:概念、技术、应用与挑战
    梁天恺, 曾碧, 陈光
    《计算机应用》唯一官方网站    2022, 42 (12): 3651-3662.   DOI: 10.11772/j.issn.1001-9081.2021101821
    摘要2523)   HTML158)    PDF (2464KB)(1731)    收藏

    在强调数据确权以及隐私保护的时代背景下,联邦学习作为一种新的机器学习范式,能够在不暴露各方数据的前提下达到解决数据孤岛以及隐私保护问题的目的。目前,基于联邦学习的建模方法已成为主流并且获得了很好的效果,因此对联邦学习的概念、技术、应用和挑战进行总结与分析具有重要的意义。首先,阐述了机器学习的发展历程以及联邦学习出现的必然性,并给出联邦学习的定义与分类;其次,介绍并分析了目前业界认可的三种联邦学习方法:横向联邦学习、纵向联邦学习和联邦迁移学习;然后,针对联邦学习的隐私保护问题,归纳并总结了目前常见的隐私保护技术;此外,还对联邦学习的现有主流开源框架进行了介绍与对比,同时给出了联邦学习的应用场景;最后,展望了联邦学习所面临的挑战和未来的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. 联邦学习通信开销研究综述
    邱鑫源, 叶泽聪, 崔翛龙, 高志强
    《计算机应用》唯一官方网站    2022, 42 (2): 333-342.   DOI: 10.11772/j.issn.1001-9081.2021020232
    摘要1766)   HTML289)    PDF (1356KB)(2285)    收藏

    为了解决数据共享需求与隐私保护要求之间不可调和的矛盾,联邦学习应运而生。联邦学习作为一种分布式机器学习,其中的参与方与中央服务器之间需要不断交换大量模型参数,而这造成了较大通信开销;同时,联邦学习越来越多地部署在通信带宽有限、电量有限的移动设备上,而有限的网络带宽和激增的客户端数量会使通信瓶颈加剧。针对联邦学习的通信瓶颈问题,首先分析联邦学习的基本工作流程;然后从方法论的角度出发,详细介绍基于降低模型更新频率、模型压缩、客户端选择的三类主流方法和模型划分等特殊方法,并对具体优化方案进行深入的对比分析;最后,对联邦学习通信开销技术研究的发展趋势进行了总结和展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 基于多尺度卷积和注意力机制的LSTM时间序列分类
    玄英律, 万源, 陈嘉慧
    《计算机应用》唯一官方网站    2022, 42 (8): 2343-2352.   DOI: 10.11772/j.issn.1001-9081.2021061062
    摘要1534)   HTML66)    PDF (711KB)(610)    收藏

    时间序列的多尺度特征包含丰富的类别信息,且这些信息对分类具有不同的重要程度,然而现有的单变量时间序列分类模型通常以固定大小的卷积核提取序列特征,导致不能有效地获取并聚焦重要的多尺度特征。针对上述问题,提出一种基于多尺度卷积和注意力机制(MCA)的长短时记忆(LSTM)模型(MCA-LSTM),它能够关注并融合重要的多尺度特征,从而实现更准确的分类。其中,LSTM使用记忆细胞和门机制控制序列信息的传递,并充分提取时间序列的相关性信息;多尺度卷积模块(MCM)使用具有不同卷积核的卷积神经网络(CNN)提取序列的多尺度特征;注意力模块(AM)融合通道信息获取特征的重要性并分配注意力权重,从而使网络关注重要的时间序列特征。在UCR档案的65个单变量时间序列数据集上的实验结果表明,对比当前最先进的基于深度学习的时间序列分类模型:USRL-FordA(Unsupervised Scalable Representation Learning-FordA)、USRL-Combined (1-NN) (Unsupervised Scalable Representation Learning-Combined (1-Nearest Neighbor)) OS-CNN(Omni-Scale Convolutional Neural Network)、Inception-Time和RTFN(Robust Temporal Feature Network for time series classification),MCA-LSTM在平均错误率(ME)上分别降低了7.48、9.92、2.43、2.09和0.82个百分点,并取得了最高的算术平均排名(AMR)和几何平均排名(GMR),分别为2.14和3.23,这些充分体现了MCA-LSTM模型在单变量时间序列分类中的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 基于深度学习的多模态医学图像分割综述
    窦猛, 陈哲彬, 王辛, 周继陶, 姚宇
    《计算机应用》唯一官方网站    2023, 43 (11): 3385-3395.   DOI: 10.11772/j.issn.1001-9081.2022101636
    摘要1428)   HTML47)    PDF (3904KB)(1143)    收藏

    多模态医学图像可以为临床医生提供靶区(如肿瘤、器官或组织)的丰富信息。然而,由于多模态图像之间相互独立且仅有互补性,如何有效融合多模态图像并进行分割仍是亟待解决的问题。传统的图像融合方法难以有效解决此问题,因此基于深度学习的多模态医学图像分割算法得到了广泛的研究。从原理、技术、问题及展望等方面对基于深度学习的多模态医学图像分割任务进行了综述。首先,介绍了深度学习与多模态医学图像分割的一般理论,包括深度学习与卷积神经网络(CNN)的基本原理与发展历程,以及多模态医学图像分割任务的重要性;其次,介绍了多模态医学图像分割的关键概念,包括数据维度、预处理、数据增强、损失函数以及后处理等;接着,对基于不同融合策略的多模态分割网络进行综述,对不同方式的融合策略进行分析;最后,对医学图像分割过程中常见的几个问题进行探讨,并对今后研究作了总结与展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 多模态预训练模型综述
    王惠茹, 李秀红, 李哲, 马春明, 任泽裕, 杨丹
    《计算机应用》唯一官方网站    2023, 43 (4): 991-1004.   DOI: 10.11772/j.issn.1001-9081.2022020296
    摘要1421)   HTML129)    PDF (5539KB)(1136)    PDF(mobile) (3280KB)(89)    收藏

    预训练模型(PTM)通过利用复杂的预训练目标和大量的模型参数,可以有效地获得无标记数据中的丰富知识。而在多模态中,PTM的发展还处于初期。根据具体模态的不同,将目前大多数的多模态PTM分为图像?文本PTM和视频?文本PTM;根据数据融合方式的不同,还可将多模态PTM分为单流模型和双流模型两类。首先,总结了常见的预训练任务和验证实验所使用的下游任务;接着,梳理了目前多模态预训练领域的常见模型,并用表格列出各个模型的下游任务以及模型的性能和实验数据比较;然后,介绍了M6(Multi-Modality to Multi-Modality Multitask Mega-transformer)模型、跨模态提示调优(CPT)模型、VideoBERT(Video Bidirectional Encoder Representations from Transformers)模型和AliceMind(Alibaba’s collection of encoder-decoders from Mind)模型在具体下游任务中的应用场景;最后,总结了多模态PTM相关工作面临的挑战以及未来可能的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 融合BERT与标签语义注意力的文本多标签分类方法
    吕学强, 彭郴, 张乐, 董志安, 游新冬
    《计算机应用》唯一官方网站    2022, 42 (1): 57-63.   DOI: 10.11772/j.issn.1001-9081.2021020366
    摘要1360)   HTML72)    PDF (577KB)(1205)    收藏

    多标签文本分类(MLTC)是自然语言处理(NLP)领域的重要子课题之一。针对多个标签之间存在复杂关联性的问题,提出了一种融合BERT与标签语义注意力的MLTC方法TLA-BERT。首先,通过对自编码预训练模型进行微调,从而学习输入文本的上下文向量表示;然后,使用长短期记忆(LSTM)神经网络将标签进行单独编码;最后,利用注意力机制显性突出文本对每个标签的贡献,以预测多标签序列。实验结果表明,与基于序列生成模型(SGM)算法相比,所提出的方法在AAPD与RCV1-v2公开数据集上,F1值分别提高了2.8个百分点与1.5个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. 基于时序超图卷积神经网络的股票趋势预测方法
    李晓杰, 崔超然, 宋广乐, 苏雅茜, 吴天泽, 张春云
    《计算机应用》唯一官方网站    2022, 42 (3): 797-803.   DOI: 10.11772/j.issn.1001-9081.2021050748
    摘要1319)   HTML53)    PDF (742KB)(599)    收藏

    传统的股票预测方法大多基于时间序列模型,忽视了股票之间复杂的关系,并且该关系往往超出成对连接,例如同行业板块内股票或者基金持仓多支股票。针对该问题,提出一种基于时序超图卷积神经网络(HGCN)的股价走势预测方法,根据金融投资事实构造超图模型以拟合股票之间的多元关系,该模型包括两大组件:门控循环单元(GRU)网络和超图卷积神经网络。GRU网络对历史数据进行时间序列建模,捕捉长期依赖关系;HGCN建模股票间的高阶关系以学习内在关系属性,从而将股票间多元关系信息引入到传统的时序建模中,进行端到端的趋势预测。在中国A股市场真实数据集上的实验结果表明,相较于已有的股票预测方法,所提模型预测性能有所提升;如与GRU网络相比,所提模型在ACC和F1_score上的相对增幅分别为9.74%和8.13%,且更具有稳定性。此外,模拟回测结果显示,基于该模型的交易策略更具获利能力,年回报率达到11.30%,与长短期记忆(LSTM)网络相比提高了5个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 基于注意力机制的多尺度残差UNet实现乳腺癌灶分割
    罗圣钦, 陈金怡, 李洪均
    《计算机应用》唯一官方网站    2022, 42 (3): 818-824.   DOI: 10.11772/j.issn.1001-9081.2021040948
    摘要1312)   HTML49)    PDF (1860KB)(344)    收藏

    针对乳腺癌灶在磁共振成像(MRI)中呈现大小形状不一、边界模糊等特点,为避免误分割并提高分割精度,提出一种基于注意力机制的多尺度残差UNet分割算法。首先,利用多尺度残差单元替换UNet在下采样过程中的相邻两个卷积块以加强对形态大小差异的关注;接着,在上采样阶段使用跨层的注意力引导网络对重点区域的关注,避免造成对健康组织的误分割;最后,引入空洞空间金字塔池化作为分割网络的桥接模块以强化对病灶的表征能力。与UNet相比,所提算法在Dice系数、交并比(IoU)、特异度(SP)、准确度(ACC)等指标上分别提升了2.26、2.11、4.16、0.05个百分点。实验结果表明,所提算法能够提高癌灶分割精度,有效降低影像诊断的假阳性率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 深度学习可解释性研究综述
    雷霞, 罗雄麟
    《计算机应用》唯一官方网站    2022, 42 (11): 3588-3602.   DOI: 10.11772/j.issn.1001-9081.2021122118
    摘要1311)   HTML66)    PDF (1703KB)(876)    收藏

    随着深度学习的广泛应用,人类越来越依赖于大量采用深度学习技术的复杂系统,然而,深度学习模型的黑盒特性对其在关键任务应用中的使用提出了挑战,引发了道德和法律方面的担忧,因此,使深度学习模型具有可解释性是使它们令人信服首先要解决的问题。于是,关于可解释的人工智能领域的研究应运而生,主要集中于向人类观察者明确解释模型的决策或行为。对深度学习可解释性的研究现状进行综述,为进一步深入研究建立更高效且具有可解释性的深度学习模型确立良好的基础。首先,对深度学习可解释性进行了概述,阐明可解释性研究的需求和定义;然后,从解释深度学习模型的逻辑规则、决策归因和内部结构表示这三个方面出发介绍了几种可解释性研究的典型模型和算法,另外还指出了三种常见的内置可解释模型的构建方法;最后,简单介绍了忠实度、准确性、鲁棒性和可理解性这四种评价指标,并讨论了深度学习可解释性未来可能的发展方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 基于多模态信息融合的时间序列预测模型
    吴明晖, 张广洁, 金苍宏
    《计算机应用》唯一官方网站    2022, 42 (8): 2326-2332.   DOI: 10.11772/j.issn.1001-9081.2021061053
    摘要1234)   HTML77)    PDF (658KB)(587)    收藏

    针对传统单因子模型无法充分利用时间序列相关信息,以及这些模型对时间序列预测准确性和可靠性较差的问题,提出一种基于多模态信息融合的时间序列预测模型——Skip-Fusion对多模态数据中的文本数据和数值数据进行融合。首先利用BERT(Bidirectional Encoder Representations from Transformers)预训练模型和独热编码对不同类别的文本数据进行编码表示;再使用基于全局注意力机制的预训练模型获得多文本特征融合的单一向量表示;然后将得到的单一向量表示与数值数据按时间顺序对齐;最后通过时间卷积网络(TCN)模型实现文本和数值特征的融合,并通过跳跃连接完成多模态数据的浅层和深层特征的再次融合。在股票价格序列的数据集上进行实验,Skip-Fusion模型的均方根误差(RMSE)和日收益(R)分别为0.492和0.930,均优于现有的单模态模型和多模态融合模型的结果,同时在可决系数(R-Squared)上取得了0.955的拟合优度。实验结果表明,Skip-Fusion模型能够有效进行多模态信息融合并具有较高的预测准确性和可靠性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 基于改进DCGAN的数据增强方法
    甘岚, 沈鸿飞, 王瑶, 张跃进
    计算机应用    2021, 41 (5): 1305-1313.   DOI: 10.11772/j.issn.1001-9081.2020071059
    摘要1054)      PDF (1499KB)(1522)    收藏
    针对小样本数据在深度学习中训练难的问题,为提高DCGAN训练效率,提出了一种改进的DCGAN算法对小样本数据进行增强。首先,使用Wasserstein距离替换原模型中的损失模型;其次,在生成网络和判别网络中加入谱归一化,以得到稳定的网络结构;最后,通过极大似然估计算法和实验估算得到样本的最佳噪声输入维度,从而提高生成样本的多样性。在MNIST、CelebA和Cartoon这三个数据集上的实验结果表明:改进后的DCGAN所生成样本的清晰度以及识别率比改进前均得到了明显提高,其中平均识别率在这几个数据集上分别提高了8.1%、16.4%和16.7%,几种清晰度评价指标在各数据集上均有不同程度的提高。可见该方法能够有效地实现小样本数据增强。
    参考文献 | 相关文章 | 多维度评价
    15. 细粒度图像分类综述
    申志军, 穆丽娜, 高静, 史远航, 刘志强
    《计算机应用》唯一官方网站    2023, 43 (1): 51-60.   DOI: 10.11772/j.issn.1001-9081.2021122090
    摘要998)   HTML53)    PDF (2674KB)(540)    收藏
    细粒度图像具有类内方差大、类间方差小的特点,致使细粒度图像分类(FGIC)的难度远高于传统的图像分类任务。介绍了FGIC的应用场景、任务难点、算法发展历程和相关的常用数据集,主要概述相关算法:基于局部检测的分类方法通常采用连接、求和及池化等操作,模型训练较为复杂,在实际应用中存在较多局限;基于线性特征的分类方法模仿人类视觉的两个神经通路分别进行识别和定位,分类效果相对较优;基于注意力机制的分类方法模拟人类观察外界事物的机制,先扫描全景,后锁定重点关注区域并形成注意力焦点,分类效果有进一步的提高。最后针对目前研究的不足,展望FGIC下一步的研究方向。
    参考文献 | 相关文章 | 多维度评价
    16. 基于注意力机制的特征融合-双向门控循环单元多模态情感分析
    赖雪梅, 唐宏, 陈虹羽, 李珊珊
    计算机应用    2021, 41 (5): 1268-1274.   DOI: 10.11772/j.issn.1001-9081.2020071092
    摘要940)      PDF (960KB)(1275)    收藏
    针对视频多模态情感分析中,未考虑跨模态的交互作用以及各模态贡献程度对最后情感分类结果的影响的问题,提出一种基于注意力机制的特征融合-双向门控循环单元多模态情感分析模型(AMF-BiGRU)。首先,利用双向门控循环单元(BiGRU)来考虑各模态中话语间的相互依赖关系,并得到各模态的内部信息;其次,通过跨模态注意力交互网络层将模态内部信息与模态之间的交互作用相结合;然后,引入注意力机制来确定各模态的注意力权重,并将各模态特征进行有效融合;最后,通过全连接层和softmax层获取情感分类结果。在公开的CMU-MOSI和CMU-MOSEI数据集上进行实验。实验结果表明,与传统的多模态情感分析方法(如多注意力循环网络(MARN))相比,AMF-BiGRU模型在CMU-MOSI数据集上的准确率和F1值分别提升了6.01%和6.52%,在CMU-MOSEI数据集上的准确率和F1值分别提升了2.72%和2.30%。可见,AMF-BiGRU模型能够有效提高多模态的情感分类性能。
    参考文献 | 相关文章 | 多维度评价
    17. 融合注意力机制的时间卷积知识追踪模型
    邵小萌, 张猛
    《计算机应用》唯一官方网站    2023, 43 (2): 343-348.   DOI: 10.11772/j.issn.1001-9081.2022010024
    摘要931)   HTML48)    PDF (2110KB)(428)    收藏

    针对基于循环神经网络(RNN)的深度知识追踪模型存在的可解释性不足和长序列依赖问题,提出一种融合注意力机制的时间卷积知识追踪(ATCKT)模型。首先,在训练阶段学习学生历史交互的嵌入表示;然后,使用基于题目的注意力机制学习特定权重矩阵,从而识别并强化学生的历史交互对每一时刻知识状态不同程度的影响;最后,使用时间卷积网络(TCN)提取学生动态变化的知识状态,在这个过程中利用扩张卷积和深层神经网络扩大序列学习范围,缓解长序列依赖问题。将ATCKT模型与深度知识追踪(DKT)、卷积知识追踪(CKT)等四种模型在ASSISTments2009、ASSISTments2015、Statics2011和Synthetic-5这4个数据集上进行对比实验,实验结果显示,所提模型的曲线下面积(AUC)和准确率(ACC)均有显著提升,尤其在ASSISTments2015数据集上表现最佳,分别提升了6.83~20.14个百分点和7.52~11.22个百分点,并且该模型的训练时间与DKT模型相比减少了26%。可见,所提模型可以更准确地捕捉学生的知识状态,更高效地预测学生未来的表现。

    图表 | 参考文献 | 相关文章 | 多维度评价
    18. 基于ZYNQ平台的YOLOv3压缩和加速
    郭文旭, 苏远歧, 刘跃虎
    计算机应用    2021, 41 (3): 669-676.   DOI: 10.11772/j.issn.1001-9081.2020060994
    摘要905)      PDF (1391KB)(1208)    收藏
    高精度物体检测网络急剧增加的参数和计算量使得它们很难在车辆和无人机等端侧设备上直接部署使用。针对这一问题,从网络压缩和计算加速两方面入手,提出了一种面向残差网络的新型压缩方案来实现YOLOv3的压缩,并通过ZYNQ平台对这一压缩后的网络进行加速。首先,提出了包括网络裁剪和网络量化两方面的网络压缩算法。网络裁剪方面,给出了针对残差结构的裁剪策略来将网络剪枝分为通道剪枝和残差链剪枝两个粒度,解决了通道剪枝无法应对残差连接的局限性,进一步降低了模型的参数量;网络量化方面,实现了一种基于相对熵的模拟量化方法,以通道为单位对参数进行量化,在线统计模型的参数分布与参数量化造成的信息损失,从而辅助选择最优量化策略来减少量化过程的精度损失。然后,在ZYNQ平台上设计并改进了8比特的卷积加速模块,从而优化了片上缓存结构并结合Winograd算法实现了压缩后YOLOv3的加速。实验结果表明,所提压缩算法较YOLOv3 tiny能够进一步降低模型尺寸,但检测精度提升了7个百分点;同时ZYNQ平台上的硬件加速方法获得了比其他平台更高的能耗比,从而推进了YOLOv3以及其他残差网络在ZYNQ端侧的实际部署。
    参考文献 | 相关文章 | 多维度评价
    19. 基于孪生网络的单目标跟踪算法综述
    王梦亭, 杨文忠, 武雍智
    《计算机应用》唯一官方网站    2023, 43 (3): 661-673.   DOI: 10.11772/j.issn.1001-9081.2022010150
    摘要902)   HTML118)    PDF (2647KB)(698)    收藏

    单目标跟踪是计算机视觉领域的一个重要研究方向,在视频监控、自动驾驶等领域应用广泛。对于单目标跟踪算法,尽管已有大量总结研究,但大多基于相关滤波或深度学习。近年来,基于孪生网络的跟踪算法因在精度和速度之间取得的平衡受到研究者们的广泛关注,然而目前对该类型算法的总结分析相对较少,并且对这些算法的架构层面缺少系统分析。为深入了解基于孪生网络的单目标跟踪算法,对大量相关文献进行了总结与分析。首先阐述孪生网络的结构和应用,并根据孪生跟踪算法架构组成的分类介绍了各跟踪算法;然后列举单目标跟踪领域常用的数据集和评价指标,对25个主流跟踪算法在OTB2015数据集上分别进行整体和各属性的性能比较与分析,并列出23个孪生跟踪算法在LaSOT和GOT-10K测试集上的性能以及推理时的速度;最后对基于孪生网络的目标跟踪算法的研究进行总结,并对未来的发展方向进行展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    20. 基于时空注意力图卷积网络模型的人体骨架动作识别算法
    李扬志, 袁家政, 刘宏哲
    计算机应用    2021, 41 (7): 1915-1921.   DOI: 10.11772/j.issn.1001-9081.2020091515
    摘要875)      PDF (1681KB)(901)    收藏
    针对现有的人体骨架动作识别算法不能充分发掘运动的时空特征问题,提出一种基于时空注意力图卷积网络(STA-GCN)模型的人体骨架动作识别算法。该模型包含空间注意力机制和时间注意力机制:空间注意力机制一方面利用光流特征中的瞬时运动信息定位运动显著的空间区域,另一方面在训练过程中引入全局平均池化及辅助分类损失使得该模型可以关注到具有判别力的非运动区域;时间注意力机制则自动地从长时复杂视频中挖掘出具有判别力的时域片段。将这二者融合到统一的图卷积网络(GCN)框架中,实现了端到端的训练。在Kinetics和NTU RGB+D两个公开数据集的对比实验结果表明,基于STA-GCN模型的人体骨架动作识别算法具有很强的鲁棒性与稳定性,与基于时空图卷积网络(ST-GCN)模型的识别算法相比,在Kinetics数据集上的Top-1和Top-5分别提升5.0和4.5个百分点,在NTURGB+D数据集的CS和CV上的Top-1分别提升6.2和6.7个百分点;也优于当前行为识别领域最先进(SOA)方法,如Res-TCN、STA-LSTM和动作-结构图卷积网络(AS-GCN)。结果表示,所提算法可以更好地满足人体行为识别的实际应用需求。
    参考文献 | 相关文章 | 多维度评价
    21. 事件抽取综述
    马春明, 李秀红, 李哲, 王惠茹, 杨丹
    《计算机应用》唯一官方网站    2022, 42 (10): 2975-2989.   DOI: 10.11772/j.issn.1001-9081.2021081542
    摘要869)   HTML134)    PDF (3054KB)(510)    收藏

    将用户感兴趣的事件从非结构化信息中提取出来,然后以结构化的方式展示给用户,这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发,事件抽取算法可以分为基于模式匹配的算法、触发词法、基于本体的算法以及前沿联合模型方法这四类。在研究过程中根据相关需求可使用不同评价方法和数据集,而不同的事件表示方法也与事件抽取研究有一定联系;以任务类型区分,元事件抽取和主题事件抽取是事件抽取的两大基本任务。其中,元事件抽取有基于模式匹配、基于机器学习和基于神经网络这三种方式,而主题事件抽取有基于事件框架和基于本体两种方式。事件抽取研究在中英等单语言上均已取得了优秀成果,而跨语言事件抽取依然面临着许多问题。最后,总结了事件抽取的相关工作并提出未来研究方向,以期为后续研究提供参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 基于深度学习的标签噪声学习算法综述
    伏博毅, 彭云聪, 蓝鑫, 秦小林
    《计算机应用》唯一官方网站    2023, 43 (3): 674-684.   DOI: 10.11772/j.issn.1001-9081.2022020198
    摘要862)   HTML66)    PDF (2083KB)(514)    PDF(mobile) (733KB)(43)    收藏

    在深度学习领域中,大量正确标注的样本对于模型的训练和学习至关重要。然而,在实际的应用场景中,标注数据的成本很高,同时标注的样本质量会受人工标注的主观因素或工具技术的影响,在标注过程中无法避免标签噪声的产生。因此,现有的训练数据都存在一定的标签噪声,如何有效地训练带标签噪声的训练数据成为了研究的热点。围绕基于深度学习的标签噪声学习算法,首先详细阐述了标签噪声学习问题的来源、分类和影响;然后依照机器学习的不同要素分析了基于数据、损失函数、模型、训练方式的四种标签噪声学习策略;随后提供了各种应用场景下学习标签噪声问题的基础框架;最后,给出一些优化思路,并展望了标签噪声学习算法面临的挑战与未来的发展方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    23. 面向自然语言处理任务的预训练模型综述
    刘睿珩, 叶霞, 岳增营
    《计算机应用》唯一官方网站    2021, 41 (5): 1236-1246.   DOI: 10.11772/j.issn.1001-9081.2020081152
    摘要855)      PDF (1296KB)(2977)    收藏
    近年来,深度学习技术得到了快速发展。在自然语言处理(NLP)任务中,随着文本表征技术从词级上升到了文档级,利用大规模语料库进行无监督预训练的方式已被证明能够有效提高模型在下游任务中的性能。首先,根据文本特征提取技术的发展,从词级和文档级对典型的模型进行了分析;其次,从预训练目标任务和下游应用两个阶段,分析了当前预训练模型的研究现状,并对代表性的模型特点进行了梳理和归纳;最后,总结了当前预训练模型发展所面临的主要挑战并提出了对未来的展望。
    参考文献 | 相关文章 | 多维度评价
    24. 基于多任务学习的时序多模态情感分析模型
    章荪, 尹春勇
    计算机应用    2021, 41 (6): 1631-1639.   DOI: 10.11772/j.issn.1001-9081.2020091416
    摘要830)      PDF (1150KB)(1167)    收藏
    针对时序多模态情感分析中存在的单模态特征表示和跨模态特征融合问题,结合多头注意力机制,提出一种基于多任务学习的情感分析模型。首先,使用卷积神经网络(CNN)、双向门控循环神经网络(BiGRU)和多头自注意力(MHSA)实现了对时序单模态的特征表示;然后,利用多头注意力实现跨模态的双向信息融合;最后,基于多任务学习思想,添加额外的情感极性分类和情感强度回归任务作为辅助,从而提升情感评分回归主任务的综合性能。实验结果表明,相较于多模态分解模型,所提模型的二分类准确度指标在CMU-MOSEI和CMU-MOSI多模态数据集上分别提高了7.8个百分点和3.1个百分点。该模型适用于多模态场景下的情感分析问题,能够为商品推荐、股市预测、舆情监控等应用提供决策支持。
    参考文献 | 相关文章 | 多维度评价
    25. 基于Sobol序列和纵横交叉策略的麻雀搜索算法
    段玉先, 刘昌云
    《计算机应用》唯一官方网站    2022, 42 (1): 36-43.   DOI: 10.11772/j.issn.1001-9081.2021010187
    摘要828)   HTML29)    PDF (771KB)(325)    收藏

    针对麻雀搜索算法(SSA)容易陷入局部最优、收敛速度较慢等问题,提出一种基于Sobol序列和纵横交叉策略的麻雀搜索算法(SSASC)。首先,在初始化阶段引入类随机采样方法中的Sobol序列,以增强种群的多样性和遍历性;其次,提出一种指数形式的非线性惯性权重,从而提高算法的收敛效率;最后,应用纵横交叉策略对算法进行改进,即利用横向交叉增强全局搜索能力,利用纵向交叉保持种群的多样性并防止算法陷入局部最优。选取了13个基准函数进行仿真实验,同时使用Wilcoxon秩和检验和Friedman检验评价算法的性能。在与其他元启发式算法的对比实验中,将基准函数从10维扩展到100维,SSASC在平均值和标准差处始终优于其他算法。实验结果表明,该算法在收敛速度和求解准确度方面均取得了一定的优势。

    图表 | 参考文献 | 相关文章 | 多维度评价
    26. 深度学习的可解释性研究综述
    李凌敏, 侯梦然, 陈琨, 刘军民
    《计算机应用》唯一官方网站    2022, 42 (12): 3639-3650.   DOI: 10.11772/j.issn.1001-9081.2021091649
    摘要815)   HTML63)    PDF (4239KB)(552)    收藏

    近年来,深度学习在很多领域得到广泛应用;然而,由于深度神经网络模型的高度非线性操作,导致其可解释性较差,并常常被称为“黑箱”模型,无法应用于一些对性能要求较高的关键领域;因此,对深度学习的可解释性开展研究是很有必要的。首先,简单介绍了深度学习;然后,围绕深度学习的可解释性,从隐层可视化、类激活映射(CAM)、敏感性分析、频率原理、鲁棒性扰动测试、信息论、可解释模块和优化方法这8个方面对现有研究工作进行分析;同时,展示了深度学习在网络安全、推荐系统、医疗和社交网络领域的应用;最后,讨论了深度学习可解释性研究存在的问题及未来的发展方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    27. 基于改进遗传算法的无人机路径规划
    黄书召, 田军委, 乔路, 王沁, 苏宇
    计算机应用    2021, 41 (2): 390-397.   DOI: 10.11772/j.issn.1001-9081.2020060797
    摘要813)      PDF (1487KB)(1151)    收藏
    针对传统遗传算法收敛速度慢、容易陷入局部最优、规划路径不够平滑、代价高等问题,提出了一种基于改进遗传算法的无人机(UAV)路径规划方法,该算法对遗传算法的选择算子、交叉算子和变异算子进行改进,从而规划出平滑、可飞的路径。首先,建立适合UAV田间信息获取的环境模型,并考虑UAV的目标函数与约束条件以建立适合本场景的更为复杂、精确的数学模型;然后,提出了混合无重串选择算子、非对称映射交叉算子和启发式多次变异算子,寻找最优路径以及扩大种群搜索范围;最后,采用三次B样条曲线对规划出的路径进行平滑,得到平滑的飞行路径,并且减少了算法的计算时间。实验结果表明,与传统遗传算法相比,所提算法的代价值降低了68%,收敛迭代次数减少了67%;相较蚁群优化(ACO)算法,其代价值降低了55%,收敛迭代次数减少了58%。通过大量对比实验得出,当交叉率的值为(1/染色体长度)时,算法的收敛效果最好。在不同环境下进行算法性能测试,结果表明所提算法具有很好的环境适应性,适合于复杂环境下的路径规划。
    参考文献 | 相关文章 | 多维度评价
    28. 基于图文融合的情感分析研究综述
    孟祥瑞, 杨文忠, 王婷
    《计算机应用》唯一官方网站    2021, 41 (2): 307-317.   DOI: 10.11772/j.issn.1001-9081.2020060923
    摘要791)      PDF (1277KB)(1702)    收藏
    随着信息化技术的不断提升,各类社交平台上带有倾向性的图文数据量快速增长,图文融合的情感分析受到广泛关注,单一的情感分析方法不再能够满足多模态数据的需求。针对图文情感特征提取与融合的技术难题,首先,列举了目前应用较广的图文情感分析数据集,介绍了文本特征和图片特征的提取方式;然后,重点研究了当前图文特征融合方式,简述了在图文情感分析过程中存在的问题;最后,针对未来情感分析的研究方向进行了总结与展望。为深入了解图文融合技术,采用文献调研方法对图文情感分析的研究进行综述,有助于比较不同融合方法之间的区别,发现更具价值的研究方案。
    参考文献 | 相关文章 | 多维度评价
    29. 基于节点相似度的无监督属性图嵌入模型
    李扬, 吴安彪, 袁野, 赵琳琳, 王国仁
    《计算机应用》唯一官方网站    2022, 42 (1): 1-8.   DOI: 10.11772/j.issn.1001-9081.2021071221
    摘要788)   HTML127)    PDF (864KB)(531)    收藏

    属性图嵌入旨在将属性图中的节点表示为低维向量,并同时保留节点的拓扑信息和属性信息。属性图嵌入已经有一系列相关工作,然而它们大多数提出的是有监督或半监督的算法。在实际应用中,需要标记的节点数量多,导致这些属性图嵌入算法的难度大,且需要消耗巨大的人力物力。针对上述问题以无监督的视角重新分析,提出了一种无监督的属性图嵌入算法。首先,通过已存在的无属性图嵌入算法和属性图的属性分别计算节点的拓扑信息和属性信息;其次,利用图卷积网络(GCN)得到节点的嵌入向量,并使得嵌入向量与拓扑信息以及嵌入向量与属性信息的差最小;最终,使拓扑信息和属性信息都相似的成对节点得到相似嵌入。与图自动编码器(GAE)方法相比,所提出的方法在Cora、Citeseer数据集上的节点分类准确率分别提升了1.2个百分点和2.4个百分点。实验结果表明,所提出的方法能够有效提高生成的嵌入的质量。

    图表 | 参考文献 | 相关文章 | 多维度评价
    30. 基于改进CenterNet的竹条表面缺陷检测方法
    高钦泉, 黄炳城, 刘文哲, 童同
    计算机应用    2021, 41 (7): 1933-1938.   DOI: 10.11772/j.issn.1001-9081.2020081167
    摘要787)      PDF (1734KB)(518)    收藏
    在竹条表面缺陷检测中,竹条表面缺陷形状各异,成像环境脏乱,现有基于卷积神经网络(CNN)的目标检测模型面对这样特定的数据时并不能很好地发挥神经网络的优势;而且竹条来源复杂且有其他条件限制,因此没办法采集所有类型的数据,导致竹条表面缺陷数据量少到CNN不能充分学习。针对这些问题,提出一种专门针对竹条表面缺陷的检测网络。该网络的基础框架为CenterNet,而且为提高CenterNet在较少的竹条表面缺陷数据中的检测性能,设计了一种基于从零开始训练的辅助检测模块:在网络开始训练时,冻结采用预训练模型的CenterNet部分,并针对竹条的缺陷特点从零开始训练辅助检测模块;待辅助检测模块损失趋于稳定时,通过一种注意力机制的连接方式将该模块与采用预训练的主干部分进行融合。将所提检测网络与CenterNet以及目前常用于工业检测的YOLO v3在相同训练测试集上进行训练和测试。实验结果表明,所提检测网络的平均精度均值(mAP)在竹条表面缺陷检测数据集上比YOLO v3和CenterNet的mAP分别提高了16.45和9.96个百分点。所提方法能够针对形状各异的竹条表面缺陷进行有效检测,且没有增加过多的时耗,在实际工业运用中具有很好的效果。
    参考文献 | 相关文章 | 多维度评价
2024年 44卷 3期
刊出日期: 2024-03-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会