摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于深度学习的多模态医学图像分割综述
    窦猛, 陈哲彬, 王辛, 周继陶, 姚宇
    《计算机应用》唯一官方网站    2023, 43 (11): 3385-3395.   DOI: 10.11772/j.issn.1001-9081.2022101636
    摘要1831)   HTML88)    PDF (3904KB)(1908)    收藏

    多模态医学图像可以为临床医生提供靶区(如肿瘤、器官或组织)的丰富信息。然而,由于多模态图像之间相互独立且仅有互补性,如何有效融合多模态图像并进行分割仍是亟待解决的问题。传统的图像融合方法难以有效解决此问题,因此基于深度学习的多模态医学图像分割算法得到了广泛的研究。从原理、技术、问题及展望等方面对基于深度学习的多模态医学图像分割任务进行了综述。首先,介绍了深度学习与多模态医学图像分割的一般理论,包括深度学习与卷积神经网络(CNN)的基本原理与发展历程,以及多模态医学图像分割任务的重要性;其次,介绍了多模态医学图像分割的关键概念,包括数据维度、预处理、数据增强、损失函数以及后处理等;接着,对基于不同融合策略的多模态分割网络进行综述,对不同方式的融合策略进行分析;最后,对医学图像分割过程中常见的几个问题进行探讨,并对今后研究作了总结与展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    2. 基于改进YOLOv8的嵌入式道路裂缝检测算法
    耿焕同, 刘振宇, 蒋骏, 范子辰, 李嘉兴
    《计算机应用》唯一官方网站    2024, 44 (5): 1613-1618.   DOI: 10.11772/j.issn.1001-9081.2023050635
    摘要1639)   HTML48)    PDF (2002KB)(1637)    收藏

    在边缘端设备部署YOLOv8L模型进行道路裂缝检测可以实现较高的精度,但难以保证实时检测。针对此问题,提出一种可部署到边缘计算设备Jetson AGX Xavier上的基于改进YOLOv8模型的目标检测算法。首先,利用部分卷积设计Faster Block结构以替换YOLOv8 C2f模块中的Bottleneck结构,并将改进后的C2f模块记为C2f-Faster;其次,在YOLOv8主干网络中的每个C2f-Faster模块之后接一个SE(Squeeze-and-Excitation)通道注意力层,进一步提高检测的精度。在开源道路损害数据集RDD20(Road Damage Detection 20)上的实验结果表明:所提方法的平均F1得分为0.573,每秒检测帧数(FPS)为47,模型大小为55.5 MB,相较于GRDDC2020 (Global Road Damage Detection Challenge 2020)的SOTA(State-Of-The-Art)模型,F1得分提高了0.8个百分点,FPS提高了291.7%,模型大小减小了41.8%,实现了在边缘设备上对道路裂缝实时且准确的检测。

    图表 | 参考文献 | 相关文章 | 多维度评价
    3. 多模态知识图谱表示学习综述
    王春雷, 王肖, 刘凯
    《计算机应用》唯一官方网站    2024, 44 (1): 1-15.   DOI: 10.11772/j.issn.1001-9081.2023050583
    摘要1185)   HTML113)    PDF (3449KB)(1466)    收藏

    在综合对比传统知识图谱表示学习模型优缺点以及适用任务后,发现传统的单一模态知识图谱无法很好地表示知识。因此,如何利用文本、图片、视频、音频等多模态数据进行知识图谱表示学习成为一个重要的研究方向。同时,详细分析了常用的多模态知识图谱数据集,为相关研究人员提供数据支持。在此基础上,进一步讨论了文本、图片、视频、音频等多模态融合下的知识图谱表示学习模型,并对其中各种模型进行了总结和比较。最后,总结了多模态知识图谱表示学习如何改善经典应用,包括知识图谱补全、问答系统、多模态生成和推荐系统在实际应用中的效果,并对未来的研究工作进行了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 大语言模型的技术应用前景与风险挑战
    徐月梅, 胡玲, 赵佳艺, 杜宛泽, 王文清
    《计算机应用》唯一官方网站    2024, 44 (6): 1655-1662.   DOI: 10.11772/j.issn.1001-9081.2023060885
    摘要1170)   HTML85)    PDF (1142KB)(1054)    收藏

    针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-Trained Transformer)等语言模型为代表,综述LLM的发展脉络、核心技术和评估体系;其次,分析LLM现存的技术局限和安全风险;最后,提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM,现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺,算力需求庞大,对数据质量和数量依赖性强,语言风格单一;存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进,从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”;从政策上实时跟进,实施有针对性的监管措施,规范应用和发展。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. YOLO算法及其在自动驾驶场景中目标检测综述
    邓亚平, 李迎江
    《计算机应用》唯一官方网站    2024, 44 (6): 1949-1958.   DOI: 10.11772/j.issn.1001-9081.2023060889
    摘要886)   HTML30)    PDF (1175KB)(831)    收藏

    自动驾驶场景下的目标检测是计算机视觉中重要研究方向之一,确保自动驾驶汽车对物体进行实时准确的目标检测是研究重点。近年来,深度学习技术迅速发展并被广泛应用于自动驾驶领域中,极大促进了自动驾驶领域的进步。为此,针对YOLO(You Only Look Once)算法在自动驾驶领域中的目标检测研究现状,从以下4个方面分析。首先,总结单阶段YOLO系列检测算法思想及其改进方法,分析YOLO系列算法的优缺点;其次,论述YOLO算法在自动驾驶场景下目标检测中的应用,从交通车辆、行人和交通信号识别这3个方面分别阐述和总结研究现状及应用情况;此外,总结目标检测中常用的评价指标、目标检测数据集和自动驾驶场景数据集;最后,展望目标检测存在的问题和未来发展方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 运动想象脑电信号的跨被试动态多域对抗学习方法
    曹铉, 罗天健
    《计算机应用》唯一官方网站    2024, 44 (2): 645-653.   DOI: 10.11772/j.issn.1001-9081.2023030286
    摘要798)   HTML13)    PDF (3364KB)(227)    收藏

    解码运动想象脑电(EEG)信号是构造脑机接口(BCI)的关键技术之一。然而,脑电样本采集成本高、个体差异大,且信号具有时变性强、低信噪比等特点,构建跨被试模式识别方法成为了研究的关键。为此,提出一种跨被试动态多域对抗学习方法。首先采用样本协方差对齐和全局域鉴别器适应样本集边缘分布,随后采用多个类别子域鉴别器适应样本集条件分布,并自适应学习多域鉴别器的对抗系数。基于动态多域对抗学习策略,所提出的动态多域对抗网络(DMDAN)模型可学习到被试域间有泛化能力的深度特征。在BCI Competition IV 2A和2B公开数据集上的实验结果表明,DMDAN模型提高了跨被试域不变特征的学习能力,与现有对抗学习方法DRDA(Deep Representation Domain Adaptation)相比,在数据集2A和数据集2B上的平均分类准确率分别提高了1.80和2.52个百分点。可见,所提出的DMDAN模型提升了跨被试运动想象脑电信号解码性能,在不同数据集上具有不错的泛化性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 卷积神经网络中基于差分隐私的动量梯度下降算法
    张宇, 蔡英, 崔剑阳, 张猛, 范艳芳
    《计算机应用》唯一官方网站    2023, 43 (12): 3647-3653.   DOI: 10.11772/j.issn.1001-9081.2022121881
    摘要722)   HTML128)    PDF (1985KB)(707)    收藏

    针对卷积神经网络(CNN)模型的训练过程中,模型参数记忆数据部分特征导致的隐私泄露问题,提出一种CNN中基于差分隐私的动量梯度下降算法(DPGDM)。首先,在模型优化的反向传播过程中对梯度添加满足差分隐私的高斯噪声,并用加噪后的梯度值参与模型参数的更新过程,从而实现对模型整体的差分隐私保护;其次,为了减少引入差分隐私噪声对模型收敛速度的影响,设计学习率衰减策略,改进动量梯度下降算法;最后,为了降低噪声对模型准确率的影响,在模型优化过程中动态地调整噪声尺度的值,从而改变在每一轮迭代中需要对梯度加入的噪声量。实验结果表明,与DP-SGD (Differentially Private Stochastic Gradient Descent)相比,所提算法可以在隐私预算为0.3和0.5时,模型准确率分别提高约5和4个百分点。可见,所提算法提高了模型的可用性,并实现了对模型的隐私保护。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 基于生成对抗网络的联邦学习中投毒攻击检测方案
    陈谦, 柴政, 王子龙, 陈嘉伟
    《计算机应用》唯一官方网站    2023, 43 (12): 3790-3798.   DOI: 10.11772/j.issn.1001-9081.2022121831
    摘要705)   HTML42)    PDF (2367KB)(508)    收藏

    联邦学习(FL)是一种新兴的隐私保护机器学习(ML)范式,然而它的分布式的训练结构更易受到投毒攻击的威胁:攻击者通过向中央服务器上传投毒模型以污染全局模型,减缓全局模型收敛并降低全局模型精确度。针对上述问题,提出一种基于生成对抗网络(GAN)的投毒攻击检测方案。首先,将良性本地模型输入GAN产生检测样本;其次,使用生成的检测样本检测客户端上传的本地模型;最后,根据检测指标剔除投毒模型。同时,所提方案定义了F1值损失和精确度损失这两项检测指标检测投毒模型,将检测范围从单一类型的投毒攻击扩展至全部两种类型的投毒攻击;设计阈值判定方法处理误判问题,确保误判鲁棒性。实验结果表明,在MNIST和Fashion-MNIST数据集上,所提方案能够生成高质量检测样本,并有效检测与剔除投毒模型;与使用收集测试数据和使用生成测试数据但仅使用精确度作为检测指标的两种检测方案相比,所提方案的全局模型精确度提升了2.7~12.2个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 基于深度强化学习的无人机集群协同作战决策方法
    赵琳, 吕科, 郭靖, 宏晨, 向贤财, 薛健, 王泳
    《计算机应用》唯一官方网站    2023, 43 (11): 3641-3646.   DOI: 10.11772/j.issn.1001-9081.2022101511
    摘要698)   HTML22)    PDF (2944KB)(536)    收藏

    在无人机(UAV)集群攻击地面目标时,UAV集群将分为两个编队:主攻目标的打击型UAV集群和牵制敌方的辅助型UAV集群。当辅助型UAV集群选择激进进攻或保存实力这两种动作策略时,任务场景类似于公共物品博弈,此时合作者的收益小于背叛者。基于此,提出一种基于深度强化学习的UAV集群协同作战决策方法。首先,通过建立基于公共物品博弈的UAV集群作战模型,模拟智能化UAV集群在合作中个体与集体间的利益冲突问题;其次,利用多智能体深度确定性策略梯度(MADDPG)算法求解辅助UAV集群最合理的作战决策,从而以最小的损耗代价实现集群胜利。在不同数量UAV情况下进行训练并展开实验,实验结果表明,与IDQN(Independent Deep Q-Network)和ID3QN(Imitative Dueling Double Deep Q-Network)这两种算法的训练效果相比,所提算法的收敛性最好,且在4架辅助型UAV情况下胜率可达100%,在其他UAV数情况下也明显优于对比算法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. 基于网络结构设计的图神经网络特征选择方法
    徐大鹏, 侯新民
    《计算机应用》唯一官方网站    2024, 44 (3): 663-670.   DOI: 10.11772/j.issn.1001-9081.2023030353
    摘要687)   HTML120)    PDF (1001KB)(848)    收藏

    近年来,研究人员针对图神经网络(GNN)提出了许多改进的模型架构设计,推动了各种预测任务的性能提升。但大多数GNN变体在开始都认为节点的特征同等重要,而实际情况并非如此。针对这个问题,提出一种特征选择方法来改进现有模型,并为数据集选择出重要特征子集。所提方法由特征选择层和标签-特征单独映射两个组件构成。在特征选择层中使用Softmax归一化器和特征“软选择器”进行特征选择,在标签-特征单独映射思想下设计模型结构,为不同的标签选择对应的相关特征子集,并将多个相关特征子集作集合并运算得到最终数据集的重要特征子集。选取图注意力网络(GAT)和GATv2模型为基准模型,将算法应用到基准模型中得到新模型。实验结果表明,所提模型在6个数据集上执行节点分类任务时,准确率相较于基准模型提升了0.83%~8.79%;新模型也为6个数据集选择了对应的重要特征子集,这些重要特征子集的特征数量占各自数据集总特征数的3.94%~12.86%,将重要特征子集作为基准模型的新输入后仍然获得了95%以上的准确率(使用了所有特征),即在保证准确率的基础上减小了模型的规模。可见,所提方法能够提高节点分类准确率,并有效地为数据集选择对应的重要特征子集。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 不完整多视图聚类综述
    董瑶, 付怡雪, 董永峰, 史进, 陈晨
    《计算机应用》唯一官方网站    2024, 44 (6): 1673-1682.   DOI: 10.11772/j.issn.1001-9081.2023060813
    摘要597)   HTML17)    PDF (2050KB)(414)    收藏

    多视图聚类是近年来图数据挖掘领域的研究热点。由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此,综合研究不完整多视图聚类(IMC)近年的发展具有重要的理论意义和实践价值。首先,归纳分析不完整多视图数据缺失类型;其次,详细比较基于多核学习(MKL)、矩阵分解(MF)学习、深度学习和图学习这4类IMC方法,分析代表性方法的技术特点和区别;再次,从数据集类型、视图和类别数量、应用领域等角度总结22个公开不完整多视图数据集;继次,总结评价指标,并系统分析现有不完整多视图聚类方法在同构和异构数据集上的性能表现;最后,归纳分析不完整多视图聚类目前存在的问题、未来的发展方向和现有应用领域。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 基于Transformer-CNN的轻量级图像超分辨率重建网络
    陈豪, 夏振平, 程成, 林李兴, 张博文
    《计算机应用》唯一官方网站    2024, 44 (1): 292-299.   DOI: 10.11772/j.issn.1001-9081.2023010048
    摘要596)   HTML24)    PDF (1855KB)(362)    收藏

    针对现有超分辨率重建网络具有较高的计算复杂度和存在大量内存消耗的问题,提出了一种基于Transformer-CNN的轻量级图像超分辨率重建网络,使超分辨率重建网络更适合应用于移动平台等嵌入式终端。首先,提出了一个基于Transformer-CNN的混合模块,从而增强网络捕获局部-全局深度特征的能力;其次,提出了一个改进的倒置残差块来特别关注高频区域的特征,以提升特征提取能力和减少推理时间;最后,在探索激活函数的最佳选择后,采用GELU (Gaussian Error Linear Unit)激活函数来进一步提高网络性能。实验结果表明,所提网络可以在图像超分辨率性能和网络复杂度之间取得很好的平衡,而且在基准数据集Urban100上4倍超分辨率的推理速度达到91 frame/s,比优秀网络SwinIR (Image Restoration using Swin transformer)快11倍,表明所提网络能够高效地重建图像的纹理和细节,并减少大量的推理时间。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 横向联邦学习中差分隐私聚类算法
    徐雪冉, 杨庚, 黄喻先
    《计算机应用》唯一官方网站    2024, 44 (1): 217-222.   DOI: 10.11772/j.issn.1001-9081.2023010019
    摘要531)   HTML15)    PDF (1418KB)(281)    收藏

    聚类分析能够挖掘出数据间隐藏的内在联系并对数据进行多指标划分,从而促进个性化和精细化运营。然而,数据孤岛造成的数据碎片化和孤立化严重影响了聚类分析的应用效果。为了解决数据孤岛问题的同时保护相关数据隐私,提出本地均分扰动联邦K-means算法(ELFedKmeans)。针对横向联邦学习模式,设计了一种基于网格的初始簇心选择方法和一种隐私预算分配方案。在ELFedKmeans算法中,各站点联合协商随机种子,以较小的通信代价生成相同的随机噪声,保护了本地数据的隐私。通过理论分析证明了该算法满足差分隐私保护,并将该算法与本地差分隐私K-means(LDPKmeans)算法和混合型隐私保护K-means (HPKmeans)算法在不同的数据集上进行了对比实验分析。实验结果表明,随着隐私预算不断增大,三个算法的F-measure值均逐渐升高;误差平方和(SSE)均逐渐减小。从整体上看,ELFedKmeans算法的F-measure值比LDPKmeans算法和HPKmeans算法分别高了1.794 5%~57.066 3%和21.245 2%~132.048 8%;ELFedKmeans算法的Log(SSE)值比LDPKmeans算法和HPKmeans算法分别减少了1.204 2%~12.894 6%和5.617 5%~27.575 2%。在相同的隐私预算下,ELFedKmeans算法在聚类质量和可用性指标上优于对比算法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 基于Transformer的视觉目标跟踪方法综述
    孙子文, 钱立志, 杨传栋, 高一博, 陆庆阳, 袁广林
    《计算机应用》唯一官方网站    2024, 44 (5): 1644-1654.   DOI: 10.11772/j.issn.1001-9081.2023060796
    摘要517)   HTML20)    PDF (1615KB)(503)    收藏

    视觉目标跟踪是计算机视觉中的重要任务之一,为实现高性能的目标跟踪,近年来提出了大量的目标跟踪方法,其中基于Transformer的目标跟踪方法由于具有全局建模和联系上下文的能力,是目前视觉目标跟踪领域研究的热点。首先,根据网络结构的不同对基于Transformer的视觉目标跟踪方法进行分类,概述相关原理和模型改进的关键技术,总结不同网络结构的优缺点;其次,对这类方法在公开数据集上的实验结果进行对比,分析网络结构对性能的影响,其中MixViT-L(ConvMAE)在LaSOT和TrackingNet上跟踪成功率分别达到了73.3%和86.1%,说明基于纯Transformer两段式架构的目标跟踪方法具有更优的性能和更广的发展前景;最后,对方法当前存在的网络结构复杂、参数量大、训练要求高和边缘设备使用难度大等不足进行总结,并对今后的研究重点进行展望,通过与模型压缩、自监督学习以及Transformer可解释性分析相结合,可为基于Transformer的视觉目标跟踪提出更多可行的解决方案。

    图表 | 参考文献 | 相关文章 | 多维度评价
    15. 融合多Prompt模板的零样本关系抽取模型
    许亮, 张春, 张宁, 田雪涛
    《计算机应用》唯一官方网站    2023, 43 (12): 3668-3675.   DOI: 10.11772/j.issn.1001-9081.2022121869
    摘要477)   HTML39)    PDF (1768KB)(286)    收藏

    Prompt范式被广泛应用于零样本的自然语言处理(NLP)任务中,但是现有基于Prompt范式的零样本关系抽取(RE)模型存在答案空间映射难构造与模板选择依赖人工的问题,无法取得较好的效果。针对这些问题,提出一种融合多Prompt模板的零样本RE模型。首先,将零样本RE任务定义为掩码语言模型(MLM)任务,舍弃答案空间映射的构造,将模板输出的词与关系描述文本在词向量空间中进行比较,以此判断关系类别;其次,引入待抽取关系类别的描述文本的词性作为特征,学习该特征与各个模板之间的权重;最后,利用该权重融合多个模板输出的结果,以此减少人工选取的Prompt模板引起的性能损失。在FewRel(Few-shot Relation extraction dataset)和TACRED(Text Analysis Conference Relation Extraction Dataset)这两个数据集上的实验结果显示,与目前最优的模型RelationPrompt相比,所提模型在不同数据资源设置下,F1值分别提升了1.48~19.84个百分点和15.27~15.75个百分点。可见,所提模型在零样本RE任务上取得了显著的效果提升。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. 结合遗传算法和滚动调度的多机器人任务分配算法
    邓辅秦, 黄焕钊, 谭朝恩, 付兰慧, 张建民, 林天麟
    《计算机应用》唯一官方网站    2023, 43 (12): 3833-3839.   DOI: 10.11772/j.issn.1001-9081.2022121916
    摘要455)   HTML12)    PDF (2617KB)(261)    收藏

    研究多机器人任务分配(MRTA)的目的是提高智能工厂中机器人完成任务的效率。针对现有算法在处理大规模、多约束的MRTA时存在不足的问题,提出一种结合遗传算法和滚动调度的MRTA算法(ACGARS)。首先,在遗传算法中采用基于有向无环图(DAG)的编码方式高效地处理任务之间的优先级约束;其次,在遗传算法的初始种群中加入先验知识以提高算法的搜索效率;最后,设计基于任务组的滚动调度策略用于减小求解问题的规模,从而实现对大规模问题的高效求解。在大规模问题实例上的实验结果表明,相较于构造性启发式算法(CHA)、最小化干扰算法(MIA)和基于惩罚策略的遗传算法(GAPS)生成的方案,当任务组数为20时,所提算法生成的方案的平均订单完成时间分别缩短了30.02%、16.86%和75.65%,验证了所提算法能有效地缩短订单的平均等待时间,提升多机器人任务分配效率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 深度神经网络平均场理论综述
    颜梦玫, 杨冬平
    《计算机应用》唯一官方网站    2024, 44 (2): 331-343.   DOI: 10.11772/j.issn.1001-9081.2023020166
    摘要451)   HTML56)    PDF (1848KB)(367)    收藏

    平均场理论(MFT)为理解深度神经网络(DNN)的运行机制提供了非常深刻的见解,可以从理论上指导深度学习的工程设计。近年来,越来越多的研究人员开始投入DNN的理论研究,特别是基于MFT的一系列工作引起人们的广泛关注。为此,对深度神经网络平均场理论相关的研究内容进行综述,主要从初始化、训练过程和泛化性能这三个基本方面介绍最新的理论研究成果。在此基础上,介绍了混沌边缘和动力等距初始化的相关概念、相关特性和具体应用,分析了过参数网络以及相关等价网络的训练特性,并对不同网络架构的泛化性能进行理论分析,体现了平均场理论是理解深度神经网络机理的非常重要的基本理论方法。最后,总结了深度神经网络中初始、训练和泛化阶段的平均场理论面临的主要挑战和未来研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    18. 区块链在供应链应用中的研究现状与挑战
    葛丽娜, 徐婧雅, 王哲, 张桂芬, 颜亮, 胡政
    《计算机应用》唯一官方网站    2023, 43 (11): 3315-3326.   DOI: 10.11772/j.issn.1001-9081.2022111758
    摘要448)      PDF (2371KB)(561)    收藏

    供应链在发展过程中面临许多挑战,包括如何保证产品溯源过程中信息的真实可靠性以及溯源系统的安全性、物流运输过程中产品的安全性,以及中小企业融资过程中的信任管理等。区块链的去中心化、不可篡改、可追溯性等特点为供应链管理提供了高效的解决办法,但在实际实施过程中存在一些技术挑战。为研究区块链技术在供应链中的应用,对一些典型的应用进行讨论与分析。首先简要介绍了供应链的概念及目前面临的挑战;其次阐述了区块链在信息流、物流以及资金流这三个供应链领域中面临的问题,并对相关解决方案作了对比分析;最后对区块链在供应链实际应用中面临的技术挑战加以总结,对未来的应用进行展望。

    参考文献 | 相关文章 | 多维度评价
    19. 结合LSTM和自注意力机制的图卷积网络短期电力负荷预测
    史含笑, 王雷春
    《计算机应用》唯一官方网站    2024, 44 (1): 311-317.   DOI: 10.11772/j.issn.1001-9081.2023010078
    摘要440)   HTML14)    PDF (2173KB)(330)    收藏

    针对现有电力负荷预测模型建模工作量大、时空联合表征不足、预测精度低等问题,提出了一种结合长短期记忆(LSTM)网络和自注意力机制的图卷积网络(GCN)的短期电力负荷预测模型GCNLS-STLF。首先,利用LSTM和自注意力机制将原始多维时间序列数据转化为包含序列间关联关系的电力负荷图;然后,通过GCN、LSTM和图傅里叶变换(GFT)对电力负荷图进行特征提取;最后,使用全连接层对特征进行重构,并利用残差进行多次预测,以增强原始电力负荷数据的表达能力。在摩洛哥与巴拿马某电站的真实历史电力负荷数据上进行的短期电力负荷预测实验结果显示,与支持向量机(SVM)、LSTM、混合模型CNN-LSTM和基于注意力的CNN-LSTM(CNN-LSTM-attention)等预测模型相比,GCNLS-STLF在摩洛哥全部电力负荷测试集上的平均绝对百分比误差(MAPE)分别降低1.94、0.90、0.49和0.37个百分点;在巴拿马电力负荷测试集上的3月份MAPE分别降低1.39、0.94、0.38和0.29个百分点,6月份MAPE分别降低1.40、0.99、0.35和0.28个百分点。实验结果表明,GCNLS-STLF能有效提取电力负荷的关键特征,预测效果较好。

    图表 | 参考文献 | 相关文章 | 多维度评价
    20. 基于轻量化YOLOv5的新型菜品识别网络
    张成涵宇, 林钰哲, 谭程珂, 王俊帆, 顾烨婷, 董哲康, 高明煜
    《计算机应用》唯一官方网站    2024, 44 (2): 638-644.   DOI: 10.11772/j.issn.1001-9081.2023030271
    摘要438)   HTML22)    PDF (2914KB)(421)    收藏

    为了更好地满足中餐菜品识别对准确性和时效性的应用需求,设计一种新型的菜品识别网络。在原YOLOv5模型的基础上,结合Supermask方法与结构化通道剪枝对模型进行剪枝操作,并利用Int8量化技术最终实现对模型的轻量化处理,保证模型在菜品识别中兼顾准确率和速度,同时提高模型的可移植性。实验结果表明,所提模型在交并比(IoU)为0.5时,平均精度均值(mAP)达到99.00%,平均每帧识别时间达到59.54 ms,相较于原始YOLOv5降低了20 ms,且准确率基本保持一致。此外,利用Qt软件将新型菜品识别网络移植到瑞萨RZ/G2L开发板,构建智能出餐系统,可实现点餐、生成订单、自动出餐全流程,为未来真正的餐厅智能出餐系统的构建应用提供了理论与实践基础。

    图表 | 参考文献 | 相关文章 | 多维度评价
    21. L1正则化的深度谱聚类算法
    李文博, 刘波, 陶玲玲, 罗棻, 张航
    《计算机应用》唯一官方网站    2023, 43 (12): 3662-3667.   DOI: 10.11772/j.issn.1001-9081.2022121822
    摘要433)   HTML44)    PDF (1465KB)(374)    收藏

    针对深度谱聚类模型训练不稳定和泛化能力弱等问题,提出L1正则化的深度谱聚类算法(DSCLR)。首先,在深度谱聚类的目标函数中引入L1正则化,使深度神经网络模型生成的拉普拉斯矩阵的特征向量稀疏化,并提升模型的泛化能力;其次,通过利用参数化修正线性单元激活函数(PReLU)改进基于深度神经网络的谱聚类算法的网络结构,解决模型训练不稳定和欠拟合问题。在MNIST数据集上的实验结果表明,所提算法在聚类精度(CA)、归一化互信息(NMI)指数和调整兰德系数(ARI)这3个评价指标上,相较于深度谱聚类算法分别提升了11.85、7.75和17.19个百分点。此外,所提算法相较于深度嵌入聚类(DEC)和基于对偶自编码器网络的深度谱聚类(DSCDAN)等算法,在CA、NMI和ARI这3个评价指标上也有大幅提升。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 基于语义引导自注意力网络的换衣行人重识别模型
    钟建华, 邱创一, 巢建树, 明瑞成, 钟剑锋
    《计算机应用》唯一官方网站    2023, 43 (12): 3719-3726.   DOI: 10.11772/j.issn.1001-9081.2022121875
    摘要428)   HTML19)    PDF (2046KB)(252)    收藏

    针对换衣行人重识别(ReID)任务中有效信息提取困难的问题,提出一种基于语义引导自注意力网络的换衣ReID模型。首先,利用语义信息将图像分割出无服装图像,和原始图像一起输入双分支多头自注意力网络进行计算,分别得到衣物无关特征和完整行人特征。其次,利用全局特征重建模块(GFR),重建两种全局特征,得到的新特征中服装区域包含换衣任务中鲁棒性更好的头部特征,使得全局特征中的显著性信息更突出;利用局部特征重组重建模块(LFRR),在完整图像特征和无服装图像特征中提取头部和鞋部局部特征,强调头部和鞋部特征的细节信息,并减少换鞋造成的干扰。最后,除了使用行人重识别中常用的身份损失和三元组损失,提出特征拉近损失(FPL),拉近局部与全局特征、完整图像特征与无服装图像特征之间的距离。在PRCC(Person ReID under moderate Clothing Change)和VC-Clothes(Virtually Changing-Clothes)数据集上,与基于衣物对抗损失(CAL)模型相比,所提模型的平均精确率均值(mAP)分别提升了4.6和0.9个百分点;在Celeb-reID和Celeb-reID-light数据集上,与联合损失胶囊网络 (JLCN)模型相比,所提模型的mAP分别提升了0.2和 5.0个百分点。实验结果表明,所提模型在换衣场景中突出有效信息表达方面具有一定优势。

    图表 | 参考文献 | 相关文章 | 多维度评价
    23. 知识图谱在装备故障诊断领域的研究与应用综述
    武杰, 张安思, 吴茂东, 张仪宗, 王从宝
    《计算机应用》唯一官方网站    2024, 44 (9): 2651-2659.   DOI: 10.11772/j.issn.1001-9081.2023091280
    摘要417)   HTML43)    PDF (2858KB)(316)    收藏

    知识图谱从装备故障诊断数据中提取有用的知识,通过(实体,关系,实体)的三元组方式,对复杂装备的故障诊断信息进行有效管理,实现装备故障的快速诊断。首先,介绍装备故障诊断知识图谱的相关概念,分析装备故障诊断领域知识图谱的构建框架;其次,归纳国内外装备故障诊断知识图谱的知识抽取、知识融合以及知识推理等几个关键技术的研究现状;最后,对目前装备故障诊断知识图谱应用进行总结,提出该领域知识图谱构建的不足和面临的挑战,并对未来装备故障诊断领域提供一些新的思路。

    图表 | 参考文献 | 相关文章 | 多维度评价
    24. 基于通道选择和多维特征融合的脑电信号分类
    杨淑莹, 国海铭, 李欣
    《计算机应用》唯一官方网站    2023, 43 (11): 3418-3427.   DOI: 10.11772/j.issn.1001-9081.2022101590
    摘要408)   HTML18)    PDF (3363KB)(247)    收藏

    针对多通道脑电信号(EEG)相互干扰、存在个体差异性导致分类结果不同和单域特征识别率低等问题,提出一种通道选择和特征融合的方法。首先,对获取到的EEG进行预处理,使用梯度提升决策树(GBDT)选出重要通道;其次,采用广义预测控制(GPC)模型构建重要通道的预测信号,辨析多维相关信号之间的细微差别,再使用SE?TCNTA(Squeeze and Excitation block-Temporal Convolutional Network-Temporal Attention)模型提取不同帧之间的时序特征;然后,使用皮尔逊相关系数计算通道间的关系,提取EEG的频域特征和预测信号的控制量作为输入,建立空间图结构,并采用图卷积网络(GCN)提取频域、空域的特征;最后,将上述二者特征输入全连接层进行特征融合,实现EEG的分类。在公共数据集BCICIV_2a上的实验结果表明,在进行通道选择的情况下,与首个用于ERP检测的EEG-Inception模型以及同样采用双分支提取特征的DSCNN (Shallow Double-branch Convolutional Neural Network)模型方法相比,所提方法的分类准确率分别提升了1.47%和1.69%,Kappa值分别提升了1.25%和2.53%。所提方法能够提高EGG的分类精度,同时减少冗余数据对特征提取的影响,因此更适用于脑机接口(BCI)系统。

    图表 | 参考文献 | 相关文章 | 多维度评价
    25. 时频域多尺度交叉注意力融合的时间序列分类方法
    王美, 苏雪松, 刘佳, 殷若南, 黄珊
    《计算机应用》唯一官方网站    2024, 44 (6): 1842-1847.   DOI: 10.11772/j.issn.1001-9081.2023060731
    摘要401)   HTML9)    PDF (2511KB)(282)    收藏

    针对时间序列子序列间的潜在信息交互不足导致分类准确率低的问题,提出时频域多尺度交叉注意力融合的时间序列分类方法TFFormer(Time-Frequency Transformer)。首先,将原始时间序列的时频域谱分别划分为等长子序列,经线性投影后加入位置信息解决时间序列的点值耦合问题;其次,通过改进的多头自注意力(IMHA)模块使模型关注更重要的序列特征,解决长时间序列的前后依赖问题;最后,构造多尺度时频域交叉注意力(CMA)模块增强时间序列在时域和频域之间的信息交互,使模型进一步挖掘序列的频域信息。实验结果表明,在Trace、StarLightCurves和UWaveGestureLibraryAll数据集上,相较于全卷积网络(FCN),所提方法的分类准确率分别提高了0.3、0.9和1.4个百分点,验证了通过增强时间序列时域和频域间的信息交互,可以提高模型收敛速度和分类精度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    26. 基于改进BERT的电力领域中文分词方法
    夏飞, 陈帅琦, 华珉, 蒋碧鸿
    《计算机应用》唯一官方网站    2023, 43 (12): 3711-3718.   DOI: 10.11772/j.issn.1001-9081.2022121897
    摘要395)   HTML17)    PDF (1953KB)(225)    收藏

    针对电力领域中文文本包含大量专有词时分词效果不佳的问题,提出一种基于改进BERT (Bidirectional Encoder Representation from Transformers)的电力领域中文分词(CWS)方法。首先,构建分别涵盖通用、领域词的词典,并设计双词典匹配融合机制将词特征直接融入BERT模型,使模型更有效地利用外部知识;其次,通过引入DEEPNORM方法提高模型对于特征的提取能力,并使用贝叶斯信息准则(BIC)确定模型的最佳深度,使BERT模型稳定加深至40层;最后,采用ProbSparse自注意力机制层替换BERT模型中的经典自注意力机制层,并利用粒子群优化(PSO)算法确定采样因子的最优值,在降低模型复杂度的同时确保模型性能不变。在人工标注的电力领域专利文本数据集上进行了分词性能测试。实验结果表明,所提方法在该数据集分词任务中的F1值达到了92.87%,相较于隐马尔可夫模型(HMM)、多标准分词模型METASEG(pre-training model with META learning for Chinese word SEGmentation)与词典增强型BERT(LEBERT)模型分别提高了14.70、9.89与3.60个百分点,验证了所提方法有效提高了电力领域中文文本的分词质量。

    图表 | 参考文献 | 相关文章 | 多维度评价
    27. 改进DeepLabv3+网络的图书书脊分割算法
    姬晓飞, 张可心, 唐李荣
    《计算机应用》唯一官方网站    2023, 43 (12): 3927-3932.   DOI: 10.11772/j.issn.1001-9081.2022121887
    摘要394)   HTML11)    PDF (2364KB)(206)    收藏

    图书定位是实现图书馆智能化发展的重要技术之一,精确的书脊分割算法成为实现该目标的一大难题。基于以上情况,提出改进DeepLabv3+网络的图书书脊分割算法,以解决图书密集排列、图书存在倾斜角度和书脊纹理极相似等情况下的书脊分割难点。首先,为了提取图书图像更密集的金字塔特征,将原始DeepLabv3+网络中的空洞金字塔池化(ASPP)替换为多空洞率、多尺度的DenseASPP (Dense Atrous Spatial Pyramid Pooling)模块;其次,针对原始DeepLabv3+网络对大长宽比的目标对象分割边界不敏感的问题,在DenseASPP模块的支路加入条形池化(SP)模块以增强书脊的长条形特征;最后,参考ViT (Vision Transformer)中的多头自注意(MHSA)机制,提出一种全局信息增强的自注意模块,以增强网络获取长距离特征的能力。将所提算法在开源数据库上进行对比测试,实验结果表明,与原始DeepLabv3+网络分割算法相比,所提算法在近竖直书脊数据库上的平均交并比(MIoU)提升了1.8个百分点;在倾斜书脊数据库上的MIoU提升了4.1个百分点,达到了93.3%。以上验证了所提算法实现了有一定倾斜角度的、密集的和大长宽比的书脊目标的精确分割。

    图表 | 参考文献 | 相关文章 | 多维度评价
    28. 超边约束的异质超网络表示学习方法
    王可可, 朱宇, 王晓英, 黄建强, 曹腾飞
    《计算机应用》唯一官方网站    2023, 43 (12): 3654-3661.   DOI: 10.11772/j.issn.1001-9081.2022121908
    摘要394)   HTML34)    PDF (2264KB)(221)    收藏

    与普通网络相比,超网络具有复杂的元组关系(超边),然而现有的大多数网络表示学习方法并不能捕获元组关系。针对上述问题,提出一种超边约束的异质超网络表示学习方法(HRHC)。首先,引入一种结合团扩展和星型扩展的方法,从而将异质超网络转换为异质网络;其次,引入感知节点语义相关性的元路径游走方法捕获异质节点之间的语义关系;最后,通过超边约束机制捕获节点之间的元组关系,从而获得高质量的节点表示向量。在3个真实世界的超网络数据集上的实验结果表明,对于链接预测任务,所提方法在drug、GPS和MovieLens数据集上都取得了较好的结果;对于超网络重建任务,当超边重建比率大于0.6时,所提方法在drug数据集上的准确性(ACC)优于次优的Hyper2vec(biased 2nd order random walks in Hyper-networks),同时所提方法在GPS数据集上的ACC超过其他基线方法中次优的基于关联图的超边超边约束的异质超网络表示学习方法(HRHC-关联图)15.6个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    29. 基于改进实数编码遗传算法的神经网络超参数优化
    佘维, 李阳, 钟李红, 孔德锋, 田钊
    《计算机应用》唯一官方网站    2024, 44 (3): 671-676.   DOI: 10.11772/j.issn.1001-9081.2023040441
    摘要392)   HTML51)    PDF (1532KB)(508)    收藏

    针对神经网络超参数优化效果差、容易陷入次优解和优化效率低的问题,提出一种基于改进实数编码遗传算法(IRCGA)的深度神经网络超参数优化算法——IRCGA-DNN(IRCGA for Deep Neural Network)。首先,采用实数编码方式表示超参数的取值,使超参数的搜索空间更灵活;然后,引入分层比例选择算子增加解集多样性;最后,分别设计了改进的单点交叉和变异算子,以更全面地探索超参数空间,提高优化算法的效率和质量。基于两个仿真数据集,验证IRCGA-DNN的毁伤效果预测性能和收敛效率。实验结果表明,在两个数据集上,与GA-DNN(Genetic Algorithm for Deep Neural Network)相比,所提算法的收敛迭代次数分别减少了8.7%和13.6%,均方误差(MSE)相差不大;与IGA-DNN(Improved GA-DNN)相比,IRCGA-DNN的收敛迭代次数分别减少了22.2%和13.6%。实验结果表明,所提算法收敛速度和预测性能均更优,能有效处理神经网络超参数优化问题。

    图表 | 参考文献 | 相关文章 | 多维度评价
    30. 优化场景视角下的进化多任务优化综述
    赵佳伟, 陈雪峰, 冯亮, 候亚庆, 朱泽轩, Yew‑Soon Ong
    《计算机应用》唯一官方网站    2024, 44 (5): 1325-1337.   DOI: 10.11772/j.issn.1001-9081.2024020208
    摘要391)   HTML66)    PDF (1383KB)(551)    收藏

    随着优化问题变得日益复杂,传统的进化算法由于计算成本高昂和适用性有限而面临挑战。为了克服这些挑战,基于知识迁移的进化多任务优化(EMTO)算法应运而生,它的核心思想是通过跨任务的知识共享,同时解决多个优化问题,旨在提高进化算法在应对复杂优化场景的效率。全面总结了当前进化多任务优化研究的进展,与已有综述文章相比,从不同的研究视角进行深入探讨,并指出了现有文献中对优化场景视角分析的缺失。鉴于此,从优化问题的应用场景出发,对适用于进化多任务优化的场景及其基本解决策略进行了系统性的阐述,以帮助研究人员准确地根据具体应用需求选择合适的研究方法。此外,深入讨论进化多任务优化当前面临的挑战和未来的研究方向,旨在为未来的研究提供指导和启示。

    图表 | 参考文献 | 相关文章 | 多维度评价
    31. 基于改进YOLOv5的Logo检测算法
    李烨恒, 罗光圣, 苏前敏
    《计算机应用》唯一官方网站    2024, 44 (8): 2580-2587.   DOI: 10.11772/j.issn.1001-9081.2023081113
    摘要384)   HTML3)    PDF (4682KB)(211)    收藏

    针对Logo图像背景复杂、Logo目标尺寸多变的问题,提出了一种基于YOLOv5的改进检测算法。首先,结合CBAM(Channel Block Attention Module),分别在图像通道与空间方向进行压缩,提取图像的关键信息与重要区域;然后,使用可变空洞卷积(SAC)使网络在不同尺度下自适应地调整特征图中的感受野大小,以捕获不同尺度下的物体信息,改善网络对多尺度目标的检测效果;最后,将归一化Wasserstein距离(NWD)嵌入损失函数,将边界框建模成2D的高斯分布,计算对应的高斯分布之间的相似度,更好地度量目标之间的相似性,提高对小目标的检测性能与模型鲁棒性和稳定性。实验结果表明,在数据量较小的数据集FlickrLogos-32中,改进后算法的平均精度均值(mAP@0.5)达到90.6%,比原始YOLOv5算法提升了1个百分点;在数据量较大的数据集QMULOpenLogo中,改进后算法的mAP@0.5达到62.7%,比原始YOLOv5算法提升了2.3个百分点;在针对特定类型的Logo检测集LogoDet3K中,针对3类商标改进后算法比原始算法的mAP@0.5分别提升了1.2、1.4与1.4个百分点,说明它有更好的Logo图像小目标检测能力。

    图表 | 参考文献 | 相关文章 | 多维度评价
    32. 基于生成式对抗网络的联邦学习激励机制
    余孙婕, 曾辉, 熊诗雨, 史红周
    《计算机应用》唯一官方网站    2024, 44 (2): 344-352.   DOI: 10.11772/j.issn.1001-9081.2023020244
    摘要380)   HTML27)    PDF (2639KB)(273)    收藏

    针对当前联邦学习缺乏公平合理的激励机制,难以衡量不同数据量、不同数据质量、不同数据分布的参与节点的联邦学习贡献度等问题,提出一种基于生成式对抗网络(GAN)的联邦学习激励机制。首先,提出融合训练模型的生成式对抗网络实现高精度样本生成;随后,基于融合训练模型的生成式对抗网络实现激励机制的贡献度评估算法,该算法通过联合模型筛选样本并生成数据标签,引入参与节点的本地数据标签分布平衡非独立同分布数据标签对贡献度评估的影响;最后,使用两阶段Stackelberg博弈实现联邦学习激励过程。安全性分析结果表明,所提激励机制在联邦学习过程中保证数据安全和系统稳定。实验结果表明,所提激励机制具备正确性,贡献度评估算法在不同数据量、不同数据质量和不同数据分布的情况下均有较好的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    33. 基于路径模仿和SAC强化学习的机械臂路径规划算法
    宋紫阳, 李军怀, 王怀军, 苏鑫, 于蕾
    《计算机应用》唯一官方网站    2024, 44 (2): 439-444.   DOI: 10.11772/j.issn.1001-9081.2023020132
    摘要376)   HTML17)    PDF (2673KB)(341)    收藏

    在机械臂路径规划算法的训练过程中,由于动作空间和状态空间巨大导致奖励稀疏,机械臂路径规划训练效率低,面对海量的状态数和动作数较难评估状态价值和动作价值。针对上述问题,提出一种基于SAC(Soft Actor-Critic)强化学习的机械臂路径规划算法。通过将示教路径融入奖励函数使机械臂在强化学习过程中对示教路径进行模仿以提高学习效率,并采用SAC算法使机械臂路径规划算法的训练更快、稳定性更好。基于所提算法和深度确定性策略梯度(DDPG)算法分别规划10条路径,所提算法和DDPG算法规划的路径与参考路径的平均距离分别是0.8 cm和1.9 cm。实验结果表明,路径模仿机制能提高训练效率,所提算法比DDPG算法能更好地探索环境,使得规划路径更加合理。

    图表 | 参考文献 | 相关文章 | 多维度评价
    34. 基于生成对抗网络的联邦学习深度影子防御方案
    周辉, 陈玉玲, 王学伟, 张洋文, 何建江
    《计算机应用》唯一官方网站    2024, 44 (1): 223-232.   DOI: 10.11772/j.issn.1001-9081.2023010088
    摘要371)   HTML7)    PDF (4561KB)(173)    收藏

    联邦学习(FL)可以使用户在不直接上传原始数据的条件下完成多方数据共享和交互,有效降低隐私泄露风险。然而,现有的研究表明敌手仍可以通过共享的梯度信息重构出原始数据。为进一步保护联邦学习隐私,基于生成对抗网络(GAN)提出一种联邦学习深度影子防御方案。首先,通过生成对抗网络学习原始真实数据分布特征,并生成可替代的影子数据;然后,通过影子数据训练影子模型替代原始模型,敌手无法直接获取真实数据训练过的原始模型;最后,利用影子数据在影子模型中产生的影子梯度替代真实梯度,使敌手无法获取真实梯度。在CIFAR10和CIFAR100数据集上进行了实验:与添加噪声、梯度裁剪、梯度压缩、表征扰动和局部正则化稀疏化五种防御方案相比,在CIFAR10数据集上所提方案的均方误差(MSE)是对比方案的1.18~5.34倍,特征均方误差(FMSE)是对比方案的4.46~1.03×107倍,峰值信噪比(PSNR)是对比方案的49.9%~90.8%;在CIFAR100数据集上的MSE是对比方案的1.04~1.06倍,FMSE是对比方案的5.93~4.24×103倍,PSNR是对比方案的96.0%~97.6%。相较于深度影子防御方法,所提方案考虑了敌手的实际攻击能力和影子模型训练存在的问题,设计了威胁模型和影子模型生成算法,在理论分析和实验方面表现更好,而且能够在保证准确率的前提下有效降低联邦学习隐私泄露风险。

    图表 | 参考文献 | 相关文章 | 多维度评价
    35. 非线性时间一致性的相关滤波目标跟踪
    姜文涛, 李宛宣, 张晟翀
    《计算机应用》唯一官方网站    2024, 44 (8): 2558-2570.   DOI: 10.11772/j.issn.1001-9081.2023081121
    摘要370)   HTML0)    PDF (7942KB)(69)    收藏

    针对现有目标跟踪算法主要采用线性约束机制LADCF(Learning Adaptive Discriminative Correlation Filters)跟踪模型容易漂移的问题,提出非线性时间一致性的相关滤波目标跟踪算法。首先,结合史蒂文斯定律,提出贴近人类视觉感知特性的非线性时间一致项,使模型相对平滑地跟踪目标,从而保证跟踪连续性,避免跟踪模型漂移;其次,采用交替方向乘子法(ADMM)求解最优函数值,保证算法的跟踪实时性;最后,利用史蒂文斯定律非线性更新滤波器,使滤波器更新因子可以根据目标的变化增强和抑制滤波器,以适应目标变化,防止滤波器退化。在4个标准数据集上与主流相关滤波和深度学习算法对比实验,相较于基线算法LADCF,所提算法的跟踪精确度和成功率在OTB100数据集上分别提升了2.4和3.8个百分点;在UAV123上分别提升了1.5和2.5个百分点。实验结果表明,所提算法能有效避免跟踪模型漂移,降低滤波器退化概率,跟踪精确度和成功率较高,面对遮挡、光照变化等复杂场景时具有较强的鲁棒性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    36. 基于多层次注意力的语义增强情感分类模型
    曹建乐, 李娜娜
    《计算机应用》唯一官方网站    2023, 43 (12): 3703-3710.   DOI: 10.11772/j.issn.1001-9081.2022121894
    摘要363)   HTML29)    PDF (1638KB)(196)    收藏

    由于自然语言的复杂语义、词的多情感极性以及文本的长期依赖关系,现有的文本情感分类方法面临严峻挑战。针对这些问题,提出了一种基于多层次注意力的语义增强情感分类模型。首先,使用语境化的动态词嵌入技术挖掘词汇的多重语义信息,并且对上下文语义进行建模;其次,通过内部注意力层中的多层并行的多头自注意力捕获文本内部的长期依赖关系,从而获取全面的文本特征信息;再次,在外部注意力层中,将评论元数据中的总结信息通过多层次的注意力机制融入评论特征中,从而增强评论特征的情感信息和语义表达能力;最后,采用全局平均池化层和Softmax函数实现情感分类。在4个亚马逊评论数据集上的实验结果表明,与基线模型中表现最好的TE-GRU (Transformer Encoder with Gated Recurrent Unit)相比,所提模型在App、Kindle、Electronic和CD数据集上的情感分类准确率至少提升了0.36、0.34、0.58和0.66个百分点,验证了该模型能够进一步提高情感分类性能

    图表 | 参考文献 | 相关文章 | 多维度评价
    37. 基于多尺度时空Transformer的视频动态场景图生成模型
    王朱佳, 余宙, 俞俊, 范建平
    《计算机应用》唯一官方网站    2024, 44 (1): 47-57.   DOI: 10.11772/j.issn.1001-9081.2023060861
    摘要361)   HTML16)    PDF (2900KB)(296)    收藏

    为应对动态视频中物体间关系在时间维度上的动态变化,提出一种基于多尺度时空Transformer的视频动态场景图生成模型,在经典的Transformer架构基础上引入了多尺度建模思想,以实现对视频动态细粒度语义的精确建模。首先,在空间维度上保留了传统模型对物体在全局空间相关性的关注;同时还对物体间的相对位置进行了局部空间相关性建模,以便更好地理解人和物之间的交互动态,提供更准确的语义分析结果。其次,在时间维度上,除了保留传统模型对视频中物体短期时间相关性的关注外,还关注了同一对物体在完整视频中的长期时间相关性,通过更全面地建模物体之间的长期关系,生成更准确、连贯的场景图,在一定程度上缓解了由遮挡、重合等引起的场景图生成问题。最后,通过空间编码器与时间编码器的共同作用,更加精准地建模视频动态细粒度语义,克服了传统的单尺度模型的局限性。实验结果显示,在Action Genome基准数据集上,与基线模型STTran相比,在谓词分类、场景图分类与场景图检测三个任务的Recall@10指标上分别提升了5.0、2.8、2.9个百分点。实验结果表明,多尺度建模思想能够更加精确地建模,并有效地提高在视频动态场景图生成任务上的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    38. 超图应用方法综述:问题、进展与挑战
    曾蠡 杨婧如 黄罡 景翔 罗超然
    《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023111629
    预出版日期: 2024-01-29

    39. 基于多尺度特征融合的遥感图像语义分割方法
    吴宁, 罗杨洋, 许华杰
    《计算机应用》唯一官方网站    2024, 44 (3): 737-744.   DOI: 10.11772/j.issn.1001-9081.2023040439
    摘要355)   HTML22)    PDF (2809KB)(361)    收藏

    为提高遥感图像语义分割精度,解决深度卷积神经网络(DCNN)特征提取过程中小尺寸目标信息丢失的问题,提出一种基于多尺度特征融合的语义分割方法FuseSwin。首先,在Swin Transformer中引入注意力增强模块(AEM),以突出目标所在区域并抑制背景噪声的干扰;其次,利用特征金字塔网络(FPN)融合多尺度特征的细节信息和高级语义信息,以补充目标的特征;最后,通过空洞空间金字塔池化(ASPP)模块从融合特征图中进一步捕获目标的上下文信息,提升模型分割精度。实验结果表明,所提方法在Potsdam遥感数据集上的平均像素准确率(mPA)和平均交并比(mIoU),与DeepLabV3方法相比,分别提高了2.34、3.23个百分点;与SegFormer方法相比,分别提高了1.28、1.75个百分点,优于目前主流的分割方法。此外,将所提方法实际应用于广西钦州茅尾海的高分辨率遥感图像中的蚝排识别与分割,分别取得96.21%、91.70%的像素准确率(PA)和交并比(IoU)。

    图表 | 参考文献 | 相关文章 | 多维度评价
    40. 基于场景图感知的跨模态图像描述模型
    朱志平, 杨燕, 王杰
    《计算机应用》唯一官方网站    2024, 44 (1): 58-64.   DOI: 10.11772/j.issn.1001-9081.2022071109
    摘要355)   HTML14)    PDF (1879KB)(213)    收藏

    针对图像描述方法中对图像文本信息的遗忘及利用不充分问题,提出了基于场景图感知的跨模态交互网络(SGC-Net)。首先,使用场景图作为图像的视觉特征并使用图卷积网络(GCN)进行特征融合,从而使图像的视觉特征和文本特征位于同一特征空间;其次,保存模型生成的文本序列,并添加对应的位置信息作为图像的文本特征,以解决单层长短期记忆(LSTM)网络导致的文本特征丢失的问题;最后,使用自注意力机制提取出重要的图像信息和文本信息后并对它们进行融合,以解决对图像信息过分依赖以及对文本信息利用不足的问题。在Flickr30K和MS-COCO (MicroSoft Common Objects in COntext)数据集上进行实验的结果表明,与Sub-GC相比,SGC-Net在BLEU1 (BiLingual Evaluation Understudy with 1-gram)、BLEU4 (BiLingual Evaluation Understudy with 4-grams)、METEOR (Metric for Evaluation of Translation with Explicit ORdering)、ROUGE (Recall-Oriented Understudy for Gisting Evaluation)和SPICE (Semantic Propositional Image Caption Evaluation)指标上分别提升了1.1、0.9、0.3、0.7、0.4和0.3、0.1、0.3、0.5、0.6。可见,SGC-Net所使用的方法能够有效提升模型的图像描述性能及生成描述的流畅度。

    图表 | 参考文献 | 相关文章 | 多维度评价
2024年 44卷 10期
刊出日期: 2024-10-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会