摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于语音和文本的双模态情感识别综述
    韩令敏, 陈仙红, 熊文梦
    《计算机应用》唯一官方网站    2025, 45 (4): 1025-1034.   DOI: 10.11772/j.issn.1001-9081.2024030319
    摘要720)   HTML68)    PDF (1625KB)(2147)    收藏

    情感识别是一种让计算机识别和理解人类情感的技术,在众多领域都起着重要的作用,也是人工智能领域重要的发展方向。因此,梳理与归纳基于语音和文本的双模态情感识别的研究现状:首先,分类阐述情感表示空间;其次,按照情感数据库的情感表示空间对这些数据库进行分类,并总结常见的多模态情感数据库;再次,介绍基于语音和文本的双模态情感识别方法,包括特征提取、模态融合和决策分类,重点介绍模态融合方法并将这些方法分为特征级融合、决策级融合、模型级融合和多层次融合这4类;此外,比较和分析一系列语音和文本双模态情感识别方法的结果;最后,介绍情感识别的应用场景、面临的挑战与未来的发展方向。以上旨在对多模态情感识别,尤其是对基于语音和文本的双模态情感识别的相关工作进行分析与总结,并为情感识别提供有价值的参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    2. 基于关系网络和Vision Transformer的跨域小样本分类模型
    严一钦, 罗川, 李天瑞, 陈红梅
    《计算机应用》唯一官方网站    2025, 45 (4): 1095-1103.   DOI: 10.11772/j.issn.1001-9081.2023121852
    摘要474)   HTML10)    PDF (2414KB)(119)    收藏

    针对小样本学习模型在数据域存在偏移时分类准确度不高的问题,提出一种基于关系网络和ViT (Vision Transformer)的跨域小样本图像分类模型ReViT (Relation ViT)。首先,引入ViT作为特征提取器,并使用经过预训练的深层神经网络解决浅层神经网络的特征表达能力不足的问题;其次,以浅层卷积网络作为任务适配器提升模型的知识迁移能力,并基于关系网络和通道注意力机制构建非线性分类器;随后,将特征提取器和任务适配器进行特征融合,从而增强模型的泛化能力;最后,采取“预训练-元学习-微调-元测试”四阶段学习策略训练模型,有效融合迁移学习与元学习,进一步提升ReViT的跨域分类性能。以平均分类准确率为评估指标的实验结果表明,ReViT在跨域小样本分类问题上有良好的性能。具体地,ReViT的分类准确度在Meta-Dataset的域内场景下和域外场景下相较于次优的模型分别提升了5.82和1.71个百分点,在BCDFSL (Broader study of Cross-Domain Few-Shot Learning)数据集的3个子问题EuroSAT(European SATellite data)、CropDisease和ISIC (International Skin Imaging Collaboration)的5-way 5-shot上相较于次优的模型分别提升了1.00、1.54和2.43个百分点,在EuroSAT、CropDisease和ISIC的5-way 20-shot上相较于次优的模型分别提升了0.13、0.97和3.40个百分点,在CropDisease的5-way 50-shot上相较于次优的模型提升了0.36个百分点。可见,ReViT能在样本量稀少的图像分类任务上保持良好的准确率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    3. 基于混合负采样的图对比学习推荐算法
    田仁杰, 景明利, 焦龙, 王飞
    《计算机应用》唯一官方网站    2025, 45 (4): 1053-1060.   DOI: 10.11772/j.issn.1001-9081.2024040419
    摘要429)   HTML21)    PDF (1954KB)(786)    收藏

    对比学习(CL)具有可从原始数据中提取自监督信号的特性,为推荐系统解决数据稀疏问题提供了有力支持。然而,现有的CL推荐算法大多着眼于改进模型结构和数据增强方法,忽视了提升推荐任务中的负样本质量以及挖掘用户与项目之间潜在隐性关系的重要性。针对此问题,提出一种基于混合负采样的图对比学习推荐算法(HSGCL)。首先,与均匀采样方法从真实数据中采样不同,所提算法使用正样本混合方法将正样本信息融入负样本中;其次,通过跳跃混合方法创造富含信息的难负样本;同时,通过使用节点丢弃(ND),改变图结构以生成多个视图,并在嵌入空间中引入可控的均匀噪声平滑调整学习表示的均匀性;最后,将推荐主任务与CL任务进行联合训练。在Douban-Book、Yelp2018和Amazon-Kindle这3个公共数据集上的数值实验结果表明,相较于基线模型——轻量化图卷积网络(LightGCN),所提算法在召回率(Recall@20)上分别提升了23%、13%和7%,在归一化折损累积增益(NDCG@20)上分别提升了32%、14%和5%,且在提升负样本嵌入信息多样性方面表现优异。可见,所提算法从负采样方法和数据增强两方面进行改进,提高了负样本质量、表示分布的均匀性和推荐算法的准确性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 可解释的深度知识追踪方法综述
    索晋贤, 张丽萍, 闫盛, 王东奇, 张雅雯
    《计算机应用》唯一官方网站    2025, 45 (7): 2043-2055.   DOI: 10.11772/j.issn.1001-9081.2024070970
    摘要423)   HTML32)    PDF (2726KB)(1548)    收藏

    知识追踪(KT)是一种认知诊断方法,旨在通过学习者的历史答题记录,模拟学习者对于学习知识的掌握程度,最终预测学习者未来的答题情况。目前基于深度神经网络模型的知识追踪技术以强大的特征提取能力和优越的预测能力成为知识追踪领域研究的热点;然而,基于深度学习的知识追踪模型通常缺乏较好的可解释性。清晰的可解释性不仅可以让学习者和教师充分理解知识追踪模型的推理过程和预测结果,从而为下一步学习制定符合当前知识状态的学习计划,还能够提升学习者和教师对知识追踪模型的信任程度。因此,对可解释的深度知识追踪(DKT)方法进行综述。首先,介绍知识追踪的发展历程,并介绍可解释性的定义和必要性;其次,从特征提取和模型内部提升两方面,对解决DKT模型缺乏可解释性而提出的改进方法进行总结和梳理;再次,介绍现有的可供研究者使用的相关公开数据集,并分析数据集内的数据特征对可解释性的影响,从而探讨如何从模型性能和可解释性两个方面对知识追踪模型进行评价,并整理DKT模型在不同数据集上的性能表现;最后,对DKT模型目前存在的问题提出一些未来可能的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. 基于协作贡献网络的开源项目开发者推荐
    游兰, 张雨昂, 刘源, 陈智军, 王伟, 曾星, 何张玮
    《计算机应用》唯一官方网站    2025, 45 (4): 1213-1222.   DOI: 10.11772/j.issn.1001-9081.2024040454
    摘要414)   HTML3)    PDF (4564KB)(65)    收藏

    面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发,开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点,而它们蕴含的语义有助于精准推荐开源项目的开发者。因此,提出一种基于协作贡献网络(CCN)的开发者推荐(DRCCN)方法。首先,利用开源软件(OSS)开发者、OSS项目、OSS组织之间的贡献关系构建CCN;其次,基于CCN构建一个3层深度的异构GraphSAGE (Graph SAmple and aggreGatE)图神经网络(GNN)模型,预测开发者节点和开源项目节点之间的链接,从而产生相应的嵌入对;最后,根据预测结果,采用K最近邻(KNN)算法完成开发者推荐。在GitHub数据集上训练和测试模型的实验结果表明,相较于序列推荐的对比学习模型CL4SRec (Contrastive Learning for Sequential Recommendation),DRCCN在精确率、召回率和F1值这3个指标上分别提升了约10.7%、2.6%和4.2%。因此,所提模型可以为开源社区项目的开发者推荐提供重要的参考依据。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 面向区块链节点分析的eclipse攻击动态检测方法
    张硕, 孙国凯, 庄园, 冯小雨, 王敬之
    《计算机应用》唯一官方网站    2025, 45 (8): 2428-2436.   DOI: 10.11772/j.issn.1001-9081.2024081101
    摘要409)   HTML9)    PDF (1546KB)(70)    收藏

    eclipse攻击作为针对区块链网络层的一种显著威胁,通过控制节点的网络连接,可导致被攻击节点与整个网络的隔离,进而影响该节点接收区块和交易信息的能力。攻击者还可以在此基础上发起双重支付等攻击,这会对区块链系统造成巨大破坏。针对该问题,结合深度学习模型,提出一种面向区块链节点分析的eclipse攻击动态检测方法。首先,利用节点综合韧性指标(NCRI)表达节点的多维属性特征,并引入图注意力神经网络(GAT)动态更新网络拓扑结构的节点特征;然后,使用卷积神经网络(CNN)融合节点的多维特征;最后,结合多层感知机(MLP)来预测整体网络的脆弱性。实验结果表明,所提方法在不同的eclipse攻击强度下的准确率最高可以达到89.80%,并且能在不断变化的区块链网络中保持稳定的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 基于Transformer-GCN的源代码漏洞检测方法
    梁辰, 王奕森, 魏强, 杜江
    《计算机应用》唯一官方网站    2025, 45 (7): 2296-2303.   DOI: 10.11772/j.issn.1001-9081.2024070998
    摘要409)   HTML3)    PDF (3389KB)(887)    收藏

    针对现有的基于深度学习的源代码漏洞检测方法存在目标代码语法和语义缺失严重以及神经网络模型对目标代码图点(边)权重分配不合理等问题,提出一种基于代码属性图(CPG)与自适应图卷积网络(AT-GCN)的源代码漏洞检测方法VulATGCN。该方法使用CPG对源代码进行表征,结合CodeBERT进行节点向量化,并通过图中心性分析提取深层次结构特征,从而多维度地捕捉代码的语法和语义信息。之后,结合Transformer自注意力机制善于捕捉长距离依赖关系和图卷积网络(GCN)善于捕捉局部特征的优势设计AT-GCN模型,从而实现对不同重要性区域特征的融合学习和精确提取。在真实漏洞数据集Big-Vul和SARD上的实验结果表明,所提方法VulATGCN的平均F1分数达到了82.9%,相较于VulSniper、VulMPFF和MGVD等基于深度学习的漏洞检测方法提高了10.4%~132.9%,平均提高约52.9%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 基于YOLOv5s的复杂场景下高效烟火检测算法YOLOv5s-MRD
    侯阳, 张琼, 赵紫煊, 朱正宇, 张晓博
    《计算机应用》唯一官方网站    2025, 45 (4): 1317-1324.   DOI: 10.11772/j.issn.1001-9081.2024040527
    摘要405)   HTML16)    PDF (4304KB)(755)    收藏

    现有的烟火检测方法主要依赖员工现场巡视,效率低且实时性差,因此,提出一种基于YOLOv5s的复杂场景下的高效烟火检测算法YOLOv5s-MRD (YOLOv5s-MPDIoU-RevCol-Dyhead)。首先,采用MPDIoU (Maximized Position-Dependent Intersection over Union)方法改进边框损失函数,以适应重叠或非重叠的边界框回归(BBR),从而提高BBR的准确性和效率;其次,利用可逆柱状结构RevCol(Reversible Column)网络模型思想重构YOLOv5s模型的主干网络,使它具有多柱状网络架构,并在模型的不同层之间加入可逆链接,从而最大限度地保持特征信息以提高网络的特征提取能力;最后,引入Dynamic head检测头,以统一尺度感知、空间感知和任务感知,从而在不额外增加计算开销的条件下显著提高目标检测头的准确性和有效性。实验结果表明:在DFS(Data of Fire and Smoke)数据集上,与原始YOLOv5s算法相比,所提算法的平均精度均值(mAP@0.5)提升了9.3%,预测准确率提升了6.6%,召回率提升了13.8%。可见,所提算法能满足当前烟火检测应用场景的要求。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 基于多模态信息融合的中文拼写纠错算法
    张庆, 杨凡, 方宇涵
    《计算机应用》唯一官方网站    2025, 45 (5): 1528-1534.   DOI: 10.11772/j.issn.1001-9081.2024050628
    摘要404)   HTML5)    PDF (1480KB)(133)    收藏

    中文拼写纠错(CSC)的目标是检测和修正用户输入中文文本中的字或词级别的错误,这些错误通常是由于汉字之间的语义、字音或字形相似而导致的误用。然而,现有模型通常忽略了局部信息,无法充分捕捉不同汉字之间的字音和字形相似性,也无法有效地将这些信息与语义信息结合起来。为了解决这些问题,提出一种基于多模态信息融合的CSC算法PWSpell。该算法利用卷积注意力机制关注局部语义信息,利用拼音编码捕捉汉字之间的字音相似关系,并首次将五笔编码引入CSC领域,用于捕捉汉字之间的字形相似关系。此外,将这2种相似关系与经过BERT(Bidirectional Encoder Representation from Transformers)处理的语义信息进行选择性融合。实验结果表明,PWSpell在SIGHAN 2015测试集的检测级指标上准确率、精确率、F1值以及校正级指标精确率、F1值上均有提升,其中校正级的精确率至少提升了1个百分点;消融实验结果也验证了算法中各个模块的设计都能有效提升模型的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. 基于多视图多尺度对比学习的图协同过滤
    党伟超, 温鑫瑜, 高改梅, 刘春霞
    《计算机应用》唯一官方网站    2025, 45 (4): 1061-1068.   DOI: 10.11772/j.issn.1001-9081.2024030393
    摘要400)   HTML13)    PDF (1493KB)(463)    收藏

    针对图协同过滤推荐方法存在的单一视图局限性和数据稀疏性问题,提出一种基于多视图多尺度对比学习的图协同过滤(MVMSCL)模型。首先,根据用户-项目交互构建初始交互图,并考虑用户-项目中存在的多种潜在意图,以构建多意图分解视图;其次,利用高阶关系改进邻接矩阵,以构建协同邻居视图;再次,去除不重要的噪声交互,以构建自适应增强的初始交互图和多意图分解视图;最后,引入局部、跨层和全局3种尺度的对比学习范式生成自监督信号,从而提高推荐性能。在Gowalla、Amazon-book和Tmall 3个公共数据集上的实验结果表明,MVMSCL的推荐性能均优于对比模型。与最优基线模型DCCF(Disentangled Contrastive Collaborative Filtering framework)相比,MVMSCL的召回率Recall@20分别提升了5.7%、14.5%和10.0%,归一化折损累计增益NDCG@20分别提升了4.6%、17.9%和11.5%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 面向复杂约束多目标优化问题的双种群双阶段进化算法
    袁志超, 杨磊, 田井林, 魏晓威, 李康顺
    《计算机应用》唯一官方网站    2025, 45 (8): 2656-2665.   DOI: 10.11772/j.issn.1001-9081.2024081130
    摘要399)   HTML0)    PDF (2608KB)(413)    收藏

    针对包含复杂约束条件的约束多目标优化问题(CMOP),在确保算法满足严格约束的同时,有效平衡算法的收敛性与多样性是重大挑战。因此,提出一种双种群双阶段的进化算法(DPDSEA)。该算法引入2个独立进化种群:主种群和副种群,并分别利用可行性规则和改进的epsilon约束处理方法进行更新。在第一阶段,主种群和副种群分别探索约束Pareto前沿(CPF)与无约束Pareto前沿(UPF),从而获取UPF和CPF的位置信息;在第二阶段,设计一种分类方法,根据UPF与CPF的位置对CMOP进行分类,从而对不同类型的CMOP执行特定的进化策略;此外,提出一种随机扰动策略,在副种群进化到CPF附近时,对它进行随机扰动以产生一些位于CPF上的个体,从而促进主种群在CPF上的收敛与分布。把所提算法与6个具有代表性的算法:CMOES (Constrained Multi-objective Optimization based on Even Search)、dp-ACS (dual-population evolutionary algorithm based on Adaptive Constraint Strength)、c-DPEA (Dual-Population based Evolutionary Algorithm for constrained multi-objective optimization)、CAEAD (Constrained Evolutionary Algorithm based on Alternative Evolution and Degeneration)、BiCo (evolutionary algorithm with Bidirectional Coevolution)和DDCMOEA (Dual-stage Dual-population Evolutionary Algorithm for Constrained Multiobjective Optimization)在LIRCMOP和DASCMOP两个测试集上进行实验比较。实验结果表明,DPDSEA在23个问题中取得了15个最优反转世代距离(IGD)值和12个最优超体积(HV)值,展现了DPDSEA在处理复杂CMOP时显著的性能优势。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 基于最小先验知识的自监督学习方法
    朱俊屹, 常雷雷, 徐晓滨, 郝智勇, 于海跃, 姜江
    《计算机应用》唯一官方网站    2025, 45 (4): 1035-1041.   DOI: 10.11772/j.issn.1001-9081.2024030366
    摘要398)   HTML29)    PDF (1521KB)(485)    收藏

    为了弥补有监督学习对监督信息要求过高的不足,提出一种基于最小先验知识的自监督学习方法。首先,基于数据的先验知识聚类无标签数据,或基于有标签数据的中心距离为无标签数据生成初始标签;其次,随机抽取赋予标签后的数据,并选择机器学习方法建立子模型;再次,计算各个数据抽取的权重和误差,以求得数据平均误差作为各个数据集的数据标签度,并根据初始数据标签度设置迭代阈值;最后,比较迭代过程中数据标签度的大小和阈值决定是否达到终止条件。在10个UCI公开数据集上的实验结果表明,相较于无监督学习K-means等方法、有监督学习支持向量机(SVM)等算法和主流自监督学习TabNet(Tabular Network)等方法,所提方法在不平衡数据集不使用标签,或在平衡数据集上使用有限标签时仍可以取得较高的分类准确度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 面向数据异构的聚类联邦学习算法
    陈庆礼, 郭渊博, 方晨
    《计算机应用》唯一官方网站    2025, 45 (4): 1086-1094.   DOI: 10.11772/j.issn.1001-9081.2024010132
    摘要395)   HTML11)    PDF (2335KB)(2459)    收藏

    联邦学习(FL)是一种在隐私保护和通信效率方面极具潜力的新型机器学习模型构建范式,然而现实物联网(IoT)场景中客户端节点数据之间会存在异构性,学习一个统一的全局模型会导致模型准确率下降。为了解决这一问题,提出一种基于特征分布的聚类联邦学习(CFLFD)算法。在该算法中,对每个客户端节点从模型提取的特征进行主成分分析(PCA)后所得到的结果进行聚类,以将具有相似数据分布的客户端节点聚类在一起相互协作,从而提高模型准确率。为验证算法的有效性,在3个数据集和4种基准算法上进行大量实验。实验结果表明,与FedProx相比,CFLFD算法在CIFAR10数据集和Office-Caltech10数据集上将模型准确率分别提升了1.12和3.76个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 融合局部和全局相关性的多变量时间序列预测方法
    王翔, 陈志祥, 毛国君
    《计算机应用》唯一官方网站    2025, 45 (9): 2806-2816.   DOI: 10.11772/j.issn.1001-9081.2024091267
    摘要392)   HTML9)    PDF (2188KB)(98)    收藏

    为解决现有时间序列模型未能充分融合局部和全局依赖的问题,提出一种融合局部和全局相关性的多变量时间序列预测方法PatchLG(Patch-integrated Local-Global correlation method)。该方法基于3个关键部分:1)将时间序列划分为多个子序列(Patch),在保持时间序列的局部性的同时使模型更易于提取全局依赖;2)使用深度可分离卷积和自注意力机制建模局部和全局相关性;3)将时间序列分解为趋势项与季节项2个部分同时进行预测,并将预测结果组合起来得到最终预测结果。在7个基准数据集上的实验结果表明,PatchLG相较于最优基线方法PatchTST(Patch Time Series Transformer)在均方误差(MSE)和平均绝对误差(MAE)2个指标上平均改进量为3.0%和2.9%,同时具有较短的实际运行时间和较低的内存消耗,验证了PatchLG在时间序列预测中的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    15. 基于神经网络的多尺度信息融合时间序列长期预测模型
    李岚皓, 严皓钧, 周号益, 孙庆赟, 李建欣
    《计算机应用》唯一官方网站    2025, 45 (6): 1776-1783.   DOI: 10.11772/j.issn.1001-9081.2024070930
    摘要383)   HTML9)    PDF (1260KB)(87)    收藏

    时间序列数据广泛来源于社会各个领域,从气象学到金融学再到医学,准确的长期预测是时间序列数据分析、处理与研究中的一个关键问题。针对时间序列数据中存在的不同尺度相关性的挖掘与利用,提出一种基于神经网络的多尺度信息融合时间序列长期预测模型ScaleNN,旨在更好地处理时间序列数据中的多尺度问题,从而实现更准确的长期预测。首先,结合全连接神经网络和卷积神经网络,有效提取全局信息与局部信息,并将2种信息聚合后进行预测;其次,通过在全局信息表征模块中引入压缩机制,以更轻量化的结构接受更长的序列输入,增大模型的感知范围并提高模型效能。大量实验结果表明,ScaleNN在多个真实世界数据集上的性能优于当前该领域的优秀模型PatchTST (Patch Time Series Transformer),在运行时间降低35%的同时仅需19%的参数量。可见,ScaleNN可广泛应用于不同领域的时间序列预测问题,为交通流量预测、天气预报等领域提供预测的基础。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. 基于多视角学习的图神经网络群组推荐模型
    王聪, 史艳翠
    《计算机应用》唯一官方网站    2025, 45 (4): 1205-1212.   DOI: 10.11772/j.issn.1001-9081.2024030337
    摘要380)   HTML3)    PDF (2528KB)(170)    收藏

    针对现有基于图神经网络(GNN)的群组推荐模型难以充分利用显隐式交互信息的问题,提出一种基于多视角学习的GNN群组推荐(GRGM)模型。先根据群组交互数据构造超图、二分图和超图投影图,并针对各个图结构的特性采用相应的GNN提取图节点特征,从而充分表达用户、群组和项目之间的显隐式关系;再提出一种多视角信息融合策略,以获取最终的群组和项目表示。在Mafengwo、CAMRa2011和Weeplaces数据集上的实验结果表明,相较于基线模型ConsRec,GRGM模型的命中率(HR@5、HR@10)和归一化折损累计增益(NDCG@5、NDCG@10)在Mafengwo数据集上分别提升了3.38%、1.96%和3.67%、3.84%,在CAMRa2011数据集上分别提升了2.87%、1.18%和0.96%、1.62%,在Weeplaces数据集上分别提升了2.41%、1.69%和4.35%、2.60%。可见,GRGM模型相较于对比模型具有更好的推荐性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 端到端语音到语音翻译的优化方法综述
    宗伟, 赵悦, 李尹, 徐晓娜
    《计算机应用》唯一官方网站    2025, 45 (5): 1363-1371.   DOI: 10.11772/j.issn.1001-9081.2024050666
    摘要380)   HTML28)    PDF (2566KB)(241)    收藏

    语音到语音翻译(S2ST)是智能语音领域中新兴的研究方向,旨在将一种语言的语音准确翻译成另一种语言的语音。随着人们对跨语言交流需求的增加,S2ST受到广泛的关注,相关研究也不断涌现。传统的级联模型在S2ST过程中存在诸多问题,如错误传播、推理延迟和无法翻译无文字系统的语言等,因此如何通过端到端模型实现直接S2ST成为当前研究的重点。在全面调查端到端S2ST的基础上,详细分析和归纳了端到端S2ST的各种模型,综述了已有的相关技术,将端到端S2ST面临的挑战总结为建模负担、数据稀缺和现实应用三类问题,并重点探讨了现有工作是如何解决这三类问题的。大语言模型(LLM)强大的理解和生成能力为S2ST提供了新的可能性,同时也带来了更多的挑战。因此,讨论了LLM在S2ST中的应用,并设想了未来可能的发展方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    18. 联邦学习的高效性研究综述
    葛丽娜, 王明禹, 田蕾
    《计算机应用》唯一官方网站    2025, 45 (8): 2387-2398.   DOI: 10.11772/j.issn.1001-9081.2024081119
    摘要376)   HTML115)    PDF (702KB)(682)    收藏

    联邦学习作为一个分布式机器学习框架,解决了数据孤岛问题,对个人及企业的隐私保护起到了重要作用。然而,由于联邦学习的特点,效率问题(尤其是高昂的成本)仍旧是目前急需解决的,这一现状仍不尽如人意。因此,全面调研并总结当前主流的关于联邦学习高效性的研究。首先,回顾高效联邦学习的背景,包括它的由来以及核心思想,并解释联邦学习的概念和分类;其次,论述基于联邦学习而产生的高效性问题,并将它们分为异构性问题、个性化问题和通信代价问题;再次,在此基础上详细分析并论述高效性问题的解决方案,并将高效联邦学习研究分为模型压缩优化方法以及通信优化方法这2个类别后进行调研;继次,通过对比分析,总结各联邦学习方法的优缺点,并阐述目前高效联邦学习中仍存在的挑战;最后,给出高效联邦学习领域未来的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    19. 基于YOLOv9的交通路口图像的多目标检测算法
    廖炎华, 鄢元霞, 潘文林
    《计算机应用》唯一官方网站    2025, 45 (8): 2555-2565.   DOI: 10.11772/j.issn.1001-9081.2024071020
    摘要375)   HTML26)    PDF (5505KB)(974)    收藏

    针对交通路口图像复杂,小目标难测且目标之间易遮挡以及天气和光照变化引发的颜色失真、噪声和模糊等问题,提出一种基于YOLOv9(You Only Look Once version 9)的交通路口图像的多目标检测算法ITD-YOLOv9(Intersection Target Detection-YOLOv9)。首先,设计CoT-CAFRNet (Chain-of-Thought prompted Content-Aware Feature Reassembly Network)图像增强网络,以提升图像质量,并优化输入特征;其次,加入通道自适应特征融合(iCAFF)模块,以增强小目标及重叠遮挡目标的提取能力;再次,提出特征融合金字塔结构BiHS-FPN (Bi-directional High-level Screening Feature Pyramid Network),以增强多尺度特征的融合能力;最后,设计IF-MPDIoU (Inner-Focaler-Minimum Point Distance based Intersection over Union)损失函数,以通过调整变量因子,聚焦关键样本,并增强泛化能力。实验结果表明,在自制数据集和SODA10M数据集上,ITD-YOLOv9算法的检测精度分别为83.8%和56.3%,检测帧率分别为64.8 frame/s和57.4 frame/s。与YOLOv9算法相比,ITD-YOLOv9算法的检测精度分别提升了3.9和2.7个百分点。可见,所提算法有效实现了交通路口的多目标检测。

    图表 | 参考文献 | 相关文章 | 多维度评价
    20. 面向低能耗高性能的分类器两阶段数据选择方法
    崔双双, 王宏志, 朱加昊, 吴昊
    《计算机应用》唯一官方网站    2025, 45 (6): 1703-1711.   DOI: 10.11772/j.issn.1001-9081.2024060883
    摘要372)   HTML33)    PDF (2107KB)(142)    收藏

    针对利用海量数据构建分类模型时训练数据规模大、训练时间长且碳排放量大的问题,提出面向低能耗高性能的分类器两阶段数据选择方法TSDS (Two-Stage Data Selection)。首先,通过修正余弦相似度确定聚类中心,并将样本数据进行基于不相似点的分裂层次聚类;其次,对聚类结果按数据分布自适应抽样以组成高质量的子样本集;最后,利用子样本集在分类模型上训练,在加速训练过程的同时提升模型精度。在Spambase、Bupa和Phoneme等6个数据集上构建支持向量机(SVM)和多层感知机(MLP)分类模型,验证TSDS的性能。实验结果表明在样本数据压缩比达到85.00%的情况下,TSDS能将分类模型准确率提升3~10个百分点,同时加速模型训练,使训练SVM分类器的能耗平均降低93.76%,训练MLP分类器的能耗平均降低75.41%。可见,TSDS在大数据场景的分类任务上既能缩短训练时间和减少能耗,又能提升分类器性能,从而助力实现“双碳”目标。

    图表 | 参考文献 | 相关文章 | 多维度评价
    21. 兼容缺失模态推理的情感识别方法
    殷兵, 凌震华, 林垠, 奚昌凤, 刘颖
    《计算机应用》唯一官方网站    2025, 45 (9): 2764-2772.   DOI: 10.11772/j.issn.1001-9081.2024091262
    摘要371)   HTML7)    PDF (1596KB)(132)    收藏

    针对真实复杂场景下模态缺失带来的模型兼容性问题,提出一种支持任意模态输入的情感识别方法。首先,在预训练和精调阶段,采用模态随机丢弃的训练策略保证模型在推理阶段的兼容性;其次,分别提出时空掩码策略和基于跨模态注意力机制的特征融合机制,以减少模型过拟合的风险并优化模型跨模态特征融合的效果;最后,为了解决多种模态情感标签不一致带来的噪声标签问题,提出一种基于多原型聚类的自适应去噪策略,该策略为多种模态分别设置类中心,并通过对比每种模态特征对应的聚类类别与标签的一致性去除噪声标签。实验结果表明:在自建数据集上,所提方法相比基线AV-HuBERT(Audio-Visual Hidden unit Bidirectional Encoder Representation from Transformers)在加权平均召回率(WAR)指标上,模态对齐推理、视频缺失推理和音频缺失推理分别提升了6.98、4.09和33.05个百分点;在视频公开数据集DFEW上,相较于AV-HuBERT,所提方法取得了最高的WAR指标,达到了68.94%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 基于Transformer的深度符号回归方法
    许鹏程, 何磊, 李川, 钱炜祺, 赵暾
    《计算机应用》唯一官方网站    2025, 45 (5): 1455-1463.   DOI: 10.11772/j.issn.1001-9081.2024050609
    摘要364)   HTML6)    PDF (3565KB)(899)    收藏

    针对利用遗传进化算法解决符号回归(SR)问题时存在的种群多样性降低以及对超参数敏感等问题,提出基于Transformer的深度符号回归(DSRT)方法。该方法在利用Transformer自回归的方式生成表达式符号序列后,将数据和表达式符号序列的拟合度值的变换值当作奖励值,再利用深度强化学习的方法更新模型参数,使模型输出的表达式序列更加拟合数据,并随着模型的不断收敛找出最优的表达式。在SR基准数据集Nguyen上对DSRT方法进行有效性测试,并在200次迭代内将它与DSR(Deep Symbolic Regression)和GP(Genetic Programming)算法进行对比,实验结果验证了DSRT方法的有效性。另外,讨论了各参数对DSRT方法的影响,并在NACA4421数据上进行飞机翼型表面压力系数公式预测实验,将所得到的公式与卡门-钱学森公式作对比,找到了均方根误差(RMSE)较小的数学公式。

    图表 | 参考文献 | 相关文章 | 多维度评价
    23. 多尺度2D-Adaboost的中药材粉末显微图像识别算法
    王一丁, 王泽浩, 李耀利, 蔡少青, 袁媛
    《计算机应用》唯一官方网站    2025, 45 (4): 1325-1332.   DOI: 10.11772/j.issn.1001-9081.2024040438
    摘要364)   HTML3)    PDF (3858KB)(495)    收藏

    针对中药材粉末的显微图像中含有大量细微特征和背景干扰因素导致的同一类药材的变化过大(类内差异大)和多种药材之间特征过于相似(类间差异小)的问题,提出一种多尺度2D-Adaboost算法。首先,构建一个全局?局部特征融合的主干网络架构,以更好地提取多尺度特征,该架构通过结合Transformer和卷积神经网络(CNN)的优势能有效提取并融合各个尺度的全局和局部特征,从而显著提高主干网络的特征捕捉能力;其次,将Adaboost的单尺度输出拓展到多尺度,并构建2D-Adaboost结构的背景抑制模块,该模块将主干网络各个尺度的输出特征图划分为前景和背景,从而有效抑制背景区域的特征值,并增加判别性特征的强度;最后,在2D-Adaboost结构的每个尺度上额外添加一个分类器以构建特征细化模块,该模块通过控制温度参数协调分类器间的协作学习,从而逐步细化不同尺度的特征图,帮助网络学习更合适的特征尺度,并丰富细节特征的表示。实验结果表明,所提算法的识别准确率达到了96.85%,与ConvNeXt-L、ViT-L、Swin-L和Conformer-L模型相比分别上升了7.56、5.26、3.79和2.60个百分点。高准确率和分类效果的稳定性验证了所提算法在中药材粉末显微图像分类任务中的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    24. 基于联盟链的车载电子证据保全及其访问控制
    邵鑫, 陈自刚, 杨兴春, 朱海华, 罗文俊, 陈龙, 周由胜
    《计算机应用》唯一官方网站    2025, 45 (6): 1902-1910.   DOI: 10.11772/j.issn.1001-9081.2024030263
    摘要363)   HTML25)    PDF (2356KB)(338)    收藏

    在当今社会中,频发的汽车交通事故依然是一个严峻的现实问题。为了确保车载电子证据的可信保全和合法使用,必须采取先进的安全技术手段和严格的访问控制机制。针对车载设备电子证据的保全与共享需求,提出一种基于联盟链的证据保全及访问控制方案。首先,基于联盟链技术和星际文件系统(IPFS)实现电子证据的链上链下存储,并通过对称密钥保证证据的机密性和哈希值验证证据的完整性;其次,在电子证据的上传、管理和下载过程中,引入融合属性和角色的访问控制机制,实现细粒度和动态的访问控制管理,从而确保证据的合法访问与共享;最后,对比方案与分析性能。实验结果表明,所提方案具备机密性、完整性和不可否认性,并且在高并发请求数的情况下具有稳定性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    25. 基于大语言模型的中文开放领域实体关系抽取策略
    龚永罡, 陈舒汉, 廉小亲, 李乾生, 莫鸿铭, 刘宏宇
    《计算机应用》唯一官方网站    2025, 45 (10): 3121-3130.   DOI: 10.11772/j.issn.1001-9081.2024101536
    摘要359)   HTML12)    PDF (3025KB)(170)    收藏

    大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略利用LLM优秀的语义理解和迁移学习能力,通过多轮不同任务的对话实现实体关系抽取。首先,基于开放领域文本结构化逻辑和思维链(CoT)机制,使用LLM生成结构化摘要,避免模型产生关系、事实幻觉和无法兼顾后文信息的问题;其次,通过文本简化策略并引入可替换词表,减少上下文窗口的限制;最后,基于结构化摘要和简化文本构建多级提示模板,使用LLaMA-2-70B模型探究参数temperature对实体关系抽取的影响。测试了LLaMA-2-70B在使用所提策略前后进行实体关系抽取的精准率、召回率、调和平均值(F1)和精确匹配(EM)值。实验结果表明,在CL-NE-DS、DiaKG和CCKS2021等5个不同领域的中文数据集上,所提策略提升了LLM在命名实体识别(NER)和关系抽取(RE)上的性能。特别是在专业性强且模型零样本测试结果不佳的DiaKG和IEPA数据集上,在应用所提策略后,相较于少样本提示测试,在NER上模型的精准率分别提升了9.3和6.7个百分点,EM值提升了2.7和2.2个百分点;在RE上模型的精准率分别提升了12.2和16.0个百分点,F1值分别提升了10.7和10.0个百分点。实验结果验证了所提策略能有效提升LLM实体关系抽取的效果并解决模型性能不稳定的问题。

    图表 | 参考文献 | 相关文章 | 多维度评价
    26. 基于改进时域卷积网络与多头自注意力机制的间歇过程质量预测模型
    赵小强, 柳勇勇, 惠永永, 刘凯
    《计算机应用》唯一官方网站    2025, 45 (7): 2245-2252.   DOI: 10.11772/j.issn.1001-9081.2024070945
    摘要355)   HTML2)    PDF (4130KB)(241)    收藏

    为提高时域卷积网络(TCN)在批量大小变化时的训练稳定性,并解决间歇过程质量预测在捕捉长期依赖性和全局关联性上存在不足而导致的预测准确度不高的问题,提出一种基于批量组规范化(BGN)和Mish激活函数改进残差结构的TCN(BMTCN)与多头自注意力机制(MHSA)的间歇过程质量预测模型(BMTCN-MHSA)。首先,将间歇过程的三维数据展开为二维矩阵形式,并对数据进行归一化处理,再引入奇异谱分析法(SSA)分解重构数据;其次,在时域卷积的残差部分融入BGN以降低网络模型在批量大小变化时的敏感度,引入Mish激活函数以提高模型的泛化能力,并利用多头自注意力机制对序列中不同位置的特征信息进行关联和权重分配,从而进一步提取序列中的关键特征信息和相互依赖关系,进而更好地捕捉间歇过程的动态特征;最后,使用青霉素仿真实验数据进行实验验证。实验结果表明,相较于TCN模型,BMTCN-MHSA模型的平均绝对误差(MAE)降低了56.86%,均方误差(MSE)降低了48.80%,而决定系数(R2)达到了99.48%,这表明BMTCN-MHSA模型提高了间歇过程质量预测的准确性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    27. 基于张量化图卷积网络和对比学习的多源数据表示学习模型
    龙雨菲, 牟宇辰, 刘晔
    《计算机应用》唯一官方网站    2025, 45 (5): 1372-1378.   DOI: 10.11772/j.issn.1001-9081.2024071001
    摘要355)   HTML17)    PDF (821KB)(292)    收藏

    针对现有多源数据表示学习模型在处理大规模复杂高维数据时存在的容易遗漏数据源间高阶关联信息和易受到噪声干扰的问题,提出一种基于张量化图卷积网络(T-GCN)和对比学习的多源数据表示学习模型(MS-TGC)。首先,利用K近邻(KNN)算法和图卷积网络(GCN)统一多源数据维度,拼接得到张量化多源数据;其次,利用定义的张量图卷积算子实现高维图卷积运算,同时学习数据源内部信息及数据源间关联信息;最后,构建多源数据对比学习范式,通过添加基于语义一致性与标签一致性的对比约束,提升MS-TGC在处理含噪声数据时的表示学习准确率,增强模型的鲁棒性。实验结果表明,当有标签样本率为0.3时,与CONMF(Co-consensus Orthogonal Non-negative Matrix Factorization)模型相比,MS-TGC在BDGP和20newsgroup数据集上的半监督分类准确率分别提升了1.36和5.53个百分点。可见MS-TGC能够更有效地捕捉数据源间关联信息,降低噪声干扰,得到高质量多源数据表示。

    图表 | 参考文献 | 相关文章 | 多维度评价
    28. 基于动态上采样的轻量级生成对抗网络DU-FastGAN
    徐国愚, 闫晓龙, 张一丹
    《计算机应用》唯一官方网站    2025, 45 (10): 3067-3073.   DOI: 10.11772/j.issn.1001-9081.2024101535
    摘要354)   HTML68)    PDF (3450KB)(293)    收藏

    近年来,生成对抗网络(GAN)被广泛应用于数据增强,能有效缓解训练样本不足的问题,对模型训练具有重要研究意义。然而,现有用于数据增强的GAN模型存在对数据集要求高和模型收敛不稳定等问题,导致生成的图像易出现失真和形变。因此,提出一种基于动态上采样的轻量级GAN——DU-FastGAN(Dynamic-Upsample-FastGAN)进行数据增强。首先,通过动态上采样模块构建生成器,使生成器能够根据当前特征图的大小采用不同粒度的上采样方法,从而重建纹理,提高合成的整体结构和局部细节的质量;其次,为了使模型能够更好地获取图像的全局信息流,提出权重信息跳跃连接模块,以减小卷积及池化操作对特征的扰动,提高模型对不同特征的学习能力,使得模型生成图像的细节更逼真;最后,给出特征丢失损失函数,通过计算采样过程中对应特征图之间的相对距离提高模型生成质量。实验结果表明,相较于FastGAN、MixDL(Mixup-based Distance Learning)和RCL-master(Reverse Contrastive Learning-master)等方法,DU-FastGAN在10个小数据集上的FID(Fréchet Inception Distance)的最大降幅达到23.47%,能够有效缓解生成图像的失真和形变问题,并提高了生成图像的质量;同时,DU-FastGAN的模型训练时间在600 min内,实现了轻量级开销。

    图表 | 参考文献 | 相关文章 | 多维度评价
    29. 基于个性化子模型和K均值聚类的联邦学习公平性算法
    景忠瑞, 陈学斌, 菅银龙, 钟琪, 张镇博
    《计算机应用》唯一官方网站    2025, 45 (12): 3747-3756.   DOI: 10.11772/j.issn.1001-9081.2024121794
    摘要354)   HTML37)    PDF (995KB)(188)    收藏

    传统联邦学习(FL)未考虑协作公平性,导致客户端获得的奖励与它的实际贡献不匹配。针对这一问题,提出一种基于个性化子模型和K均值聚类的联邦学习公平性算法(FedPSK)。首先,根据神经网络中神经元的激活模式对神经元聚类,且仅对聚类后的簇中心神经元进行重要性评估,并使用簇中心神经元的评分代表簇中其他神经元的评分,从而降低神经元评估的耗时;其次,使用层次选取方式选择客户端子模型中包含的神经元数量及编号,并为每个客户端建立具有完整神经网络结构的子模型;最后,通过为客户端下发子模型,实现协作公平性。在不同数据集上的实验结果表明,在公平度量的相关系数方面,FedPSK比FedSAC(Federated learning framework with dynamic Submodel Allocation for Collaborative fairness)提高了2.70%;在时间开销方面,FedPSK比FedSAC至少降低了84.12%。可见,FedPSK在提升FL算法公平性的同时,极大地降低了算法运行的时间开销,验证了所提算法的高效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    30. 联邦学习中针对后门攻击的检测与防御方案
    苏锦涛, 葛丽娜, 肖礼广, 邹经, 王哲
    《计算机应用》唯一官方网站    2025, 45 (8): 2399-2408.   DOI: 10.11772/j.issn.1001-9081.2024081120
    摘要353)   HTML112)    PDF (2521KB)(325)    收藏

    针对联邦学习(FL)系统中普遍存在的恶意后门攻击行为,以及现有防御方案难以在隐私保护与模型训练的高准确率之间取得平衡的难题,探索FL中的后门攻击及其防御方法,提出一种名为GKFL (Generative Knowledge-based Federated Learning)的安全高效集成方案用于检测后门攻击并修复受损模型。该方案无需访问参与方的原始隐私数据,通过中央服务器生成检测数据检测联邦学习中的聚合模型是否遭受后门入侵,并采用知识蒸馏技术恢复受损模型,从而确保模型的完整性和准确性。在数据集MNIST和Fashion-MNIST上的实验结果表明,GKFL的总体性能均优于经典方案FoolsGold、GeoMed和RFA (Robust Federated Aggregation);GKFL比FoolsGold更能保护数据的隐私。可见,GKFL方案拥有检测后门攻击及修复受损模型的能力,并在模型中毒准确率和模型主任务准确率上明显优于对比方案。

    图表 | 参考文献 | 相关文章 | 多维度评价
    31. 基于双注意力机制和多尺度融合的点云分类与分割网络
    李维刚, 邵佳乐, 田志强
    《计算机应用》唯一官方网站    2025, 45 (9): 3003-3010.   DOI: 10.11772/j.issn.1001-9081.2024091254
    摘要350)   HTML2)    PDF (2371KB)(41)    收藏

    现有的网络难以有效学习点云局部的几何形状信息,存在无法有效关注重要特征结构和融合不充分等问题。因此,提出一种基于双注意力机制(DAM)和多尺度融合的点云分类与分割网络。首先,在数据特征提取阶段利用几何自适应卷积(GAC)动态地调整卷积核的几何位置和权重,使它能够动态适应点云数据的局部几何结构,从而更有效地捕捉局部特征;其次,为了进一步提升特征表达能力,引入DAM自动学习并调整特征通道和空间信息的权重,从而增强关键点的特征表示;最后,连接不同尺度的特征信息以进行有效融合,从而增强特征学习效果,使得最终的特征表示更加丰富,以提高网络的分类分割精度。在ModelNet40、ShapeNet和S3DIS数据集上的实验结果表明,所提网络与PointNet++和DGCNN(Dynamic Graph Convolutional Neural Network)相比,总体分类精度(OA)和平均交并比(mIoU)更好,有效提升了点云分类与分割的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    32. 基于区块链的数字内容版权保护和公平追踪方案
    王利娥, 林彩怡, 李永东, 傅星珵, 李先贤
    《计算机应用》唯一官方网站    2025, 45 (6): 1756-1765.   DOI: 10.11772/j.issn.1001-9081.2024060901
    摘要345)   HTML8)    PDF (3016KB)(86)    收藏

    针对数字内容版权保护和追踪过程中的版权所有者恶意诬陷购买者,以及购买者知道自己的水印而进行去水印操作的问题,提出一种基于区块链的数字内容版权保护和公平追踪方案。首先,使用Paillier同态加密算法和密钥分发智能合约更改密文状态下购买者水印,并将水印嵌入加密的数字内容;其次,通过区块链中的验证节点调用密钥分发智能合约和仲裁智能合约,解决传统版权保护方案存在的单点故障问题;最后,通过实验验证所提方案的性能。结果表明,所提方案在数字内容尺寸(像素×像素)为1 024×1 024时,相较于针对垂直行业服务信息泄露的区块链问责机制,所提方案加密和嵌入水印的总时间减少了94.92%,总解密时间减少了79.72%。可见,所提方案的总时间和运行成本低,具有良好的运行效率,能够广泛用于数字内容版权保护领域。

    图表 | 参考文献 | 相关文章 | 多维度评价
    33. 基于分段注意力机制的时间序列预测模型
    王慧斌, 胡展傲, 胡节, 徐袁伟, 文博
    《计算机应用》唯一官方网站    2025, 45 (7): 2262-2268.   DOI: 10.11772/j.issn.1001-9081.2024070929
    摘要340)   HTML6)    PDF (831KB)(79)    收藏

    针对时间序列分段后存在因采样间隔增大而导致的长期预测过程中局部依赖关系丢失的情况,提出一种基于分段注意力机制的时间序列预测模型(SAMformer)。首先,显式地将时间静态协变量与原始数据按比例融合,以增强数据的时域信息表征能力;其次,同时引入两个连续的带偏置的线性层和一个激活函数来微调融合数据,从而提高模型对非线性数据的拟合能力;然后,在分段序列的每个段内引入点积注意力机制,以便捕获局部特征依赖关系;最后,利用跨尺度依赖的编码器-解码器架构预测时序数据。所提模型在公开的5个时间序列数据集上的实验结果表明,相较于Crossformer、 Pyraformer和Informer等其他监督学习时序预测模型,SAMformer的均方误差(MSE)和平均绝对误差(MAE)分别降低了2.0%~62.0%和0.9%~49.8%。此外,通过消融实验验证了所提不同组件的完备性和有效性,进一步说明了融合时域信息和段内注意力机制有助于提高时间序列预测的精度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    34. 集成特征注意力和残差连接的偏标签回归算法
    吴海峰, 陶丽青, 程玉胜
    《计算机应用》唯一官方网站    2025, 45 (8): 2530-2536.   DOI: 10.11772/j.issn.1001-9081.2024071012
    摘要337)   HTML3)    PDF (1384KB)(212)    收藏

    偏标签回归(PLR)弥补了偏标签学习(PLL)仅聚焦于分类任务的局限。针对现有的PLR算法忽略实例特征的特性差异的问题,提出一种集成特征注意力和残差连接的偏标签回归算法(PLR-FARC)。首先,通过标签增强技术将真实数据集的标签扩充为一组实值候选标签;其次,借助注意力机制自动生成每个特征对标签的贡献度;再次,引入残差连接以减少特征在传递过程中的信息丢失,从而维持特征的完整性;最后,分别基于IDent (IDentification method)和PIDent (Progressive IDentification method)计算预测损失。在Abalone、Airfoil、Concrete、Cpu-act、Housing和Power-plant数据集上的实验结果表明,相较于IDent和PIDent,PLR-FARC的平均绝对误差(MAE)分别平均降低了2.15%、38.38%、8.86%、4.19%、15.71%和15.55%,均方误差(MSE)分别平均降低了9.35%、71.32%、23.10%、20.17%、27.22%和9.46%。可见,所提算法是可行且有效的。

    图表 | 参考文献 | 相关文章 | 多维度评价
    35. 跨模态文本信息增强的多模态情感分析模型
    王艺涵, 路翀, 陈忠源
    《计算机应用》唯一官方网站    2025, 45 (7): 2237-2244.   DOI: 10.11772/j.issn.1001-9081.2024060886
    摘要335)   HTML6)    PDF (1163KB)(70)    收藏

    近年来,利用文本、视觉和音频数据分析视频中说话者情感的多模态情感分析(MSA)引起了广泛关注。然而,不同模态在情感分析中的贡献大不相同。通常,文本中包含的信息更加直观,因此寻求一种用于增强文本在情感分析中作用的策略显得尤为重要。针对这一问题,提出一种跨模态文本信息增强的多模态情感分析模型(MSAM-CTE)。首先,使用BERT(Bidirectional Encoder Representations from Transformers)预训练模型提取文本特征,并使用双向长短期记忆(Bi-LSTM)网络对预处理后的音频和视频特征进行进一步处理;其次,通过基于文本的交叉注意力机制,将文本信息融入情感相关的非语言表示中,以学习面向文本的成对跨模态映射,从而获得有效的统一多模态表示;最后,使用融合特征进行情感分析。实验结果表明,与最优的基线模型——文本增强Transformer融合网络(TETFN)相比,MSAM-CTE在数据集CMU-MOSI (Carnegie Mellon University Multimodal Opinion Sentiment Intensity)上的平均绝对误差(MAE)和皮尔逊相关系数(Corr)分别降低了2.6%和提高了0.1%;在数据集CMU-MOSEI (Carnegie Mellon University Multimodal Opinion Sentiment and Emotion Intensity)上的两个指标分别降低了3.8%和提高了1.7%,验证了MSAM-CTE在情感分析中的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    36. 基于路径和增强三元组文本的开放世界知识推理模型
    王利琴, 耿智雷, 李英双, 董永峰, 边萌
    《计算机应用》唯一官方网站    2025, 45 (4): 1177-1183.   DOI: 10.11772/j.issn.1001-9081.2024030265
    摘要335)   HTML0)    PDF (838KB)(210)    收藏

    传统的基于表示学习的知识推理方法只能用于封闭世界的知识推理,有效进行开放世界的知识推理是目前的热点问题。因此,提出一种基于路径和增强三元组文本的开放世界知识推理模型PEOR(Path and Enhanced triplet text for Open world knowledge Reasoning)。首先,使用由实体对间结构生成的多条路径和单个实体周围结构生成的增强三元组,其中路径文本通过拼接路径中的三元组文本得到,而增强三元组文本通过拼接头实体邻域文本、关系文本和尾实体邻域文本得到;其次,使用BERT(Bidirectional Encoder Representations from Transformers)分别编码路径文本和增强三元组文本;最后,使用路径向量和三元组向量计算语义匹配注意力,再使用语义匹配注意力聚合多条路径的语义信息。在3个开放世界知识图谱数据集WN18RR、FB15k-237和NELL-995上的对比实验结果表明,与次优模型BERTRL(BERT-based Relational Learning)相比,所提模型的命中率(Hits@10)指标分别提升了2.6、2.3和8.5个百分点,验证了所提模型的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    37. 基于分布式环境的图神经网络模型训练效率与训练性能评估
    涂银川, 郭勇, 毛恒, 任怡, 张建锋, 李宝
    《计算机应用》唯一官方网站    2025, 45 (8): 2409-2420.   DOI: 10.11772/j.issn.1001-9081.2024081140
    摘要330)   HTML95)    PDF (1623KB)(113)    收藏

    随着图数据规模的快速增长,图神经网络(GNN)在处理大规模图结构数据时面临计算和存储方面的挑战。传统的单机训练方法已不足以应对日益庞大的数据集和复杂的GNN模型,分布式训练凭借并行计算能力和可扩展性,成为解决这些问题的有效途径。然而,一方面,已有的分布式GNN训练评估主要关注以模型精度为代表的性能指标和以训练时间为代表的效率指标,而较少关注数据处理效率和计算资源利用方面的指标;另一方面,算法效率评估的主要场景为单机单卡或单机多卡,而已有的评估方法在分布式环境中的应用相对简单。针对这些不足,提出针对分布式场景的模型训练的评估方法,涵盖评估指标、数据集和模型这3个方面。根据评估方法,选取3个代表性GNN模型,在4个具有不同数据特征的大型公开图数据集上进行分布式训练实验,并收集和分析得到的评估指标。实验结果表明,分布式训练中的模型架构和数据结构特征对模型复杂度、训练时间、计算节点吞吐量和计算节点平均吞吐量之比(NATR)均有影响;样本处理与数据拷贝占用了模型训练较多时间,计算节点互相等待的时间也不容忽视;相较于单机训练,分布式训练的计算节点吞吐量有显著降低,且需要进一步优化分布式系统中的资源利用。可见,所提评估方法为GNN模型在分布式环境中的训练性能优化提供了参考依据,并为模型的进一步优化和算法的改进奠定了实验基础。

    图表 | 参考文献 | 相关文章 | 多维度评价
    38. 联合任务卸载和资源优化的车辆边缘计算方案
    薛天宇, 李爱萍, 段利国
    《计算机应用》唯一官方网站    2025, 45 (6): 1766-1775.   DOI: 10.11772/j.issn.1001-9081.2024060905
    摘要329)   HTML14)    PDF (3414KB)(102)    收藏

    针对车辆边缘计算(VEC)中存在的用户体验质量需求不断增加、高度移动车辆引起的链路状态获取困难和异构边缘节点为车辆提供资源的时变性等问题,制定一种联合任务卸载和资源优化(JTO-RO)的VEC方案。首先,在不失一般性的前提下,综合考虑边缘内和边缘间干扰,提出一种车辆到基础设施(V2I)的传输模型,该模型通过引入非正交多址接入(NOMA)技术使边缘节点不仅无需依赖链路状态信息,还可以提升信道容量;其次,为了提高系统的性能和效率,设计一种多智能体双延迟深度确定性(MATD3)算法用于制定任务卸载策略,这些策略可通过与环境的交互学习进行动态调整;再次,联合考虑2种策略的协同作用,并制定将最大化任务服务比率作为目标的优化方案,从而满足不断提升的用户体验质量需求;最后,对真实车辆轨迹数据集进行仿真实验。结果表明,相较于当前具有代表性的3种方案(分别以随机卸载(RO)算法、D4PG (Distributed Distributional Deep Deterministic Policy Gradient)算法和MADDPG (Multi-Agent Deep Deterministic Policy Gradient)算法为任务卸载算法的方案)在3类场景下(普通场景、任务密集型场景和时延敏感型场景),所提方案的平均服务比率分别提高了20%、10%和29%以上,验证了该方案的优势和有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    39. 面向个性化与公平性的联邦学习算法
    张宏扬, 张淑芬, 谷铮
    《计算机应用》唯一官方网站    2025, 45 (7): 2123-2131.   DOI: 10.11772/j.issn.1001-9081.2024070934
    摘要328)   HTML7)    PDF (3790KB)(538)    收藏

    作为一种分布式优化范式,联邦学习(FL)允许大量资源有限的客户端节点在不共享数据时协同训练模型。然而,传统联邦学习算法,如FedAvg,通常未充分考虑公平性的问题。在实际场景中,数据分布通常具备高度异构性,常规的聚合操作可能会使模型对某些客户端产生偏见,导致全局模型在客户端本地的性能分布出现巨大差异。针对这一问题,提出一种面向个性化与公平性的联邦学习FedPF(Federated learning for Personalization and Fairness)算法。FedPF旨在有效减少联邦学习中低效的聚合行为,并通过寻找全局模型与本地模型的相关性,在客户端之间分配个性化模型,从而在保证全局模型性能的同时,使客户端本地性能分布更均衡。将FedPF在Synthetic、MNIST以及CIFAR10数据集上进行实验和性能分析,并与FedProx、q-FedAvg和FedAvg这3种联邦学习算法进行对比。实验结果表明,FedPF在有效性和公平性上均得到了有效提升。

    图表 | 参考文献 | 相关文章 | 多维度评价
    40. 开集域适应综述
    王闯, 俞璐, 陈健威, 潘成, 杜文博
    《计算机应用》唯一官方网站    2025, 45 (9): 2727-2736.   DOI: 10.11772/j.issn.1001-9081.2024091277
    摘要328)   HTML26)    PDF (859KB)(415)    收藏

    作为迁移学习的关键技术,域适应能很好地解决训练和测试数据集分布不同的问题。然而,传统的域适应方法通常只适用于目标域和源域数据集所含类别的数量和种类相同的情况,在实际场景中该条件通常很难满足。开集域适应(OSDA)正是为了解决此问题而出现的。为了填补该领域的空白,并为相关研究提供借鉴参考,对近年来出现的OSDA方法进行归纳分析。首先,介绍相关概念与基本结构;其次,分别从针对数据增强、针对特征提取以及针对分类器3个阶段梳理分析相关的典型方法;最后,对OSDA的未来发展方向进行展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
2026年 46卷 2期
刊出日期: 2026-02-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会