当期目录

    2025年 第45卷 第12期 刊出日期:2025-12-10 封面下载 目录下载
    人工智能
    基于个性化子模型和K均值聚类的联邦学习公平性算法
    景忠瑞, 陈学斌, 菅银龙, 钟琪, 张镇博
    2025, 45(12):  3747-3756.  DOI: 10.11772/j.issn.1001-9081.2024121794
    摘要 ( )   HTML ( )   PDF (995KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传统联邦学习(FL)未考虑协作公平性,导致客户端获得的奖励与它的实际贡献不匹配。针对这一问题,提出一种基于个性化子模型和K均值聚类的联邦学习公平性算法(FedPSK)。首先,根据神经网络中神经元的激活模式对神经元聚类,且仅对聚类后的簇中心神经元进行重要性评估,并使用簇中心神经元的评分代表簇中其他神经元的评分,从而降低神经元评估的耗时;其次,使用层次选取方式选择客户端子模型中包含的神经元数量及编号,并为每个客户端建立具有完整神经网络结构的子模型;最后,通过为客户端下发子模型,实现协作公平性。在不同数据集上的实验结果表明,在公平度量的相关系数方面,FedPSK比FedSAC(Federated learning framework with dynamic Submodel Allocation for Collaborative fairness)提高了2.70%;在时间开销方面,FedPSK比FedSAC至少降低了84.12%。可见,FedPSK在提升FL算法公平性的同时,极大地降低了算法运行的时间开销,验证了所提算法的高效性。

    融合外部语义知识的多标签分类方法
    杨进才, 班启旭, 杨旭生, 沈显君
    2025, 45(12):  3757-3763.  DOI: 10.11772/j.issn.1001-9081.2024121814
    摘要 ( )   HTML ( )   PDF (3195KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    文本分类作为自然语言处理(NLP)领域的重要任务,它的多标签分类因标签空间大而成为难点。针对该问题,以儿童读物中的价值观标识为实例,提出一种融合外部语义知识的多标签分类方法HSGIN(Heterogeneous Semantic Gated Interaction Network)。首先,利用SBERT (Sentence embeddings from Siamese BERT (Bidirectional Encoder Representations from Transformers))和双向长短期记忆(Bi-LSTM)网络提取文本特征;其次,通过异质图转换架构(HGT)联合建模知识图谱(KG)中的实体和关系,并利用先验知识和语义关联提取标签特征;最后,将文本特征和标签特征进行注意力融合以得到不同的标签特征表示,且引入门控图神经网络(GGNN)捕捉标签间的语义依赖和交互模式并进行预测。实验结果表明,相较于目前性能先进的对比方法BERT,所提方法的精确率、召回率和F1分数分别提升了2.66、0.47和1.16个百分点。以上实验结果验证了所提方法的有效性,同时,对儿童读物中价值观标识的精准分析有助于为儿童选择健康的读物。

    基于分层强化学习的知识图谱约束问答模型
    许浩翔, 余敦辉, 邓怡辰, 肖奎
    2025, 45(12):  3764-3770.  DOI: 10.11772/j.issn.1001-9081.2024121806
    摘要 ( )   HTML ( )   PDF (761KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对知识图谱问答(KGQA)中忽略约束信息和长路径推理的维数灾难问题,提出一种基于分层强化学习(HRL)的知识图谱约束问答(KGQA-HRL)模型。首先,深度融合HRL理念,拆解知识图谱中的三元组,并设计出上层策略和底层策略,从而化解推理路径的维数灾难隐患;其次,为了提高路径选择的准确性,提出基于注意力机制的动作选择策略和融合约束信息的实体选择策略,从而有效压缩推理的搜索范围;再次,在动作选择与实体选择策略之间嵌入问题更新环节,从而使每跳问题进行二次更新;最后,在实体选择策略中构建约束集并计算约束得分,以考虑问题中的约束信息,从而提高实体选择的准确性。基于4个KGQA基准数据集,对KGQA-HRL模型的性能进行实验的结果显示:KGQA-HRL模型在所有数据集上均达到最优准确率,较之前最佳模型约束路径推理(COPAR)提升了2.9%,且在复杂的3跳查询任务中表现突出(PQ (PathQuestion)数据集上提升了3.6%,MetaQA数据集上提升了2.5%),验证了KGQA-HRL模型优异的推理能力。

    基于层次信息增强的中文语义错误识别模型
    张瑜琦, 沙灜
    2025, 45(12):  3771-3778.  DOI: 10.11772/j.issn.1001-9081.2024111694
    摘要 ( )   HTML ( )   PDF (615KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    中文语义错误不同于简单的拼写错误和语法错误,它们通常更加隐蔽和复杂。中文语义错误识别(CSER)旨在判断中文句子是否包含语义错误,作为语义校对的前置任务,识别模型的性能对语义错误校对至关重要。针对CSER模型在融合句法信息时忽视句法结构与上下文结构之间差异的问题,提出一种层次信息增强的图卷积神经网络(HIE-GCN)模型,旨在将句法树中节点的层次信息嵌入上下文编码器,从而缩小句法结构与上下文结构之间的差异。首先,采用遍历算法提取句法树中节点的层次信息;其次,将层次信息嵌入BERT(Bidirectional Encoder Representations from Transformers)模型生成字符特征,而图卷积网络(GCN)将字符特征用于图上节点,并在图卷积计算后得到整个句子的特征向量;最后,利用全连接层进行单分类错误识别或多分类错误识别。在FCGEC(Fine-grained corpus for Chinese Grammatical Error Correction)和NaCGEC(Native Chinese Grammatical Error Correction)数据集上进行语义错误识别和校对的实验结果表明,在识别任务中,与基线模型相比,HIE-GCN模型在FCGEC数据集的单分类错误识别中将准确率至少提高0.10个百分点,F1值至少提高0.13个百分点;在多分类错误识别中将准确率至少提高1.05个百分点,F1值至少提高0.53个百分点;消融实验验证了层次信息嵌入的有效性;与GPT、Qwen等多个大语言模型(LLM)相比,所提模型的整体识别性能更高。在校对实验中,与序列到序列的直接纠错模型相比,采用识别-纠错二阶段流水线可将纠错精确率提高8.01个百分点,同时还发现,在LLM GLM4纠错过程中,向模型提示句子错误类型可将纠错的精确率提高4.62个百分点。

    融合情感词典的多视角语言特征方面情感三元组抽取模型
    张正悦, 彭菊红, 丁子胥, 范馨予, 胡长玉
    2025, 45(12):  3779-3785.  DOI: 10.11772/j.issn.1001-9081.2024121863
    摘要 ( )   HTML ( )   PDF (729KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在自然语言处理(NLP)任务中,方面情感三元组抽取(ASTE)旨在识别文本中方面词、观点词和情感极性之间的联系,是实现细粒度情感分析的关键步骤。在当前的主流方法中,端到端模型普遍存在对语言特征理解不足以及对情感表达稀疏性处理不佳的问题,进而限制了模型的准确性和鲁棒性,而管道式模型存在传播错误问题。针对上述问题,提出一种融合情感词典的多视角语言特征ASTE模型(MVLF-SL)。在MVLF-SL中,多视角语言特征能够帮助模型理解上下文和隐含语义,而情感词典能够提供额外的情感先验知识。首先,利用图卷积网络(GCN)对多视角语言特征进行特征表达,并得到增强的语言特征;其次,使用动态融合策略将增强的语言特征与情感词典相融合;再次,利用多层GCN结合邻接关系和节点特征增强方面词和观点词的特征表示;最后,利用双仿射注意力(BA)机制改进的边界驱动的表格填充(BDTF)方法对三元组进行解码和抽取。实验结果表明,在ASTE-DATA-V2数据集的4个子数据集14res、14lap、15res和16res上,相较于BDTF模型,MVLF-SL的F1分数分别提升了0.57、2.08、2.20、1.74个百分点。可见,所提模型能在ASTE上取得更好的表现,并充分利用了语言特征和外部情感知识。

    基于话题博文的食品安全网络舆情评论文本多情感分析
    吕星辰, 林伟君, 黄红星
    2025, 45(12):  3786-3795.  DOI: 10.11772/j.issn.1001-9081.2024111712
    摘要 ( )   HTML ( )   PDF (907KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了解决食品安全网络舆情中评论文本情感复杂多样,且依赖讨论的话题和博文信息的问题,提出一种融合话题博文的评论文本多情感分析模型TBR-MSAM(Topic Blog Review-Multi-Sentiment Analysis Model)。首先,使用RoBERTa(Robustly optimized BERT (Bidirectional Encoder Representations from Transformers)pretraining approach)和深度学习模型构建话题博文评论特征提取(TBR-FE)模块分别对话题、博文和评论信息进行上下文特征提取;其次,构建话题博文评论的交互注意力特征融合(TBR-IAFF)模块对话题-评论和博文-评论进行两两交互以获得交互特征,并进行权重的合理分配,从而挖掘话题、博文和评论之间的复杂关系;接着,构建话题博文评论的交叉特征融合(TBR-CFF)模块对多个信息进行深层次特征融合,从而挖掘用户潜在的情感特征;最后,通过Softmax对食品安全网络舆情中评论文本的4种情感极性进行分类。在所构建的3个食品安全网络舆情数据集上的实验结果表明,相较于无话题和博文信息的最优基线模型,TBR-MSAM的Macro-F1和准确率分别至少提升了5.0和5.8个百分点;相较于融合话题和博文信息的最优基线模型,TBR-MSAM的Macro-F1和准确率分别至少提升0.2和1.1个百分点;相较于同时带有话题、博文和评论文本信息的最优基线模型,TBR-MSAM的Macro-F1和准确率分别至少提升了11.7和10.0个百分点,验证了TBR-MSAM在食品安全网络舆情的多情感分类任务中的有效性。

    因果干预下的多模态命名实体识别
    孟佳娜, 白晨皓, 赵迪, 王博林, 高临霖
    2025, 45(12):  3796-3803.  DOI: 10.11772/j.issn.1001-9081.2024111681
    摘要 ( )   HTML ( )   PDF (902KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    多模态命名实体识别(MNER)任务旨在从文本和图像的联合数据中识别出具有特定意义的实体;然而,当前的方法在处理数据偏差和模态差距这2个问题时存在不足。数据偏差会导致有害的偏差误导注意力模块关注训练数据中的虚假相关性,从而损害模型的泛化能力;模态差距则会阻碍文本和图像之间建立正确的语义对齐,从而影响模型的性能。为了解决这2个问题,提出一种因果干预下的多模态命名实体识别(CMNER)方法。该方法利用因果干预理论,在文本模态中使用后门干预处理可观测到的混杂因素,在图像模态使用前门因果干预处理不可直接观测到的混杂因素,以此减轻数据偏差带来的有害影响;同时,结合互信息(MI)相关理论,拉近文本和图像之间的语义“距离”。在多模态领域中验证所提方法的实体识别效果,在数据集Twitter-2015和Twitter-2017上的实验结果表明,CMNER方法的F1分数分别达到了76.00%和88.60%,与次优方法相比分别提高了0.58和0.53个百分点,达到最优水平。可见,CMNER方法可以有效缓解数据偏差和缩小模态差距,进而提升MNER任务的性能。

    渐进式表征学习语音情感识别方法CnnPRL
    樊永红, 黄鹤鸣
    2025, 45(12):  3804-3812.  DOI: 10.11772/j.issn.1001-9081.2024111704
    摘要 ( )   HTML ( )   PDF (2403KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    语音情感识别(SER)旨在赋予计算机准确识别语音信号中的情感状态的能力,而如何高效地表征语音中的情感特征一直是SER的研究热点。目前,大多数研究都致力于利用深度学习方法直接从原始语音或语谱图中学习最优特征,这种学习模式可以提取到更完整的特征信息,但忽略了对特定特征更深层细化信息的学习,同时不能保证特征的可解释性。为了解决上述问题,提出一种基于卷积神经网络的渐进式表征学习SER方法(CnnPRL),在语音声学特征的基础上利用卷积神经网络(CNN)渐进式地提取具有可解释性的精细化情感特征。首先,手工提取可解释的浅层特征并选择出最优的特征集;其次,提出级联CNN和动态融合结构,以细化浅层特征,并学习深层情感表征;最后,构建并行异构CNN提取不同尺度的互补特征,以利用融合模块实现多特征融合,捕获多粒度特征,并整合来自不同特征尺度的深层情感信息。实验结果表明,在保证时间复杂度的前提下,在数据集IEMOCAP (Interactive EMOtional dyadic motion CAPture database)、CASIA(Institute of Automation, Chinese Academy of Sciences)和EMODB(Berlin EMOtional DataBase)上,相较于SpeechFormer++、TLFMRF(Two-Layer Fuzzy Multiple Random Forest)和TIM-Net(Temporal-aware bI-direction Multi-scale Network)等对比方法,CnnPRL在指标加权平均召回率(WAR)上分别至少取得了0.86、2.92和1.46个百分点的提升,验证了CnnPRL的有效性;消融实验结果验证了CnnPRL的每个模块都有利于提升模型的整体性能。

    基于特征交互与表示增强的语音手机来源开集识别方法
    岳峰, 彭洋, 苏兆品, 张国富, 廉晨思, 杨波, 方振
    2025, 45(12):  3813-3819.  DOI: 10.11772/j.issn.1001-9081.2024121815
    摘要 ( )   HTML ( )   PDF (759KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于手机语音的多媒体取证任务一直都是研究热点,然而已有语音手机识别任务均局限于闭集模式,即训练集与测试集共享相同的类别集合,无法保证未知类别手机的识别精度,所以现有方法无法直接应用于未知手机。为此,提出一种基于特征交互与表示增强的语音手机来源开集识别方法(FireOSCI)。首先,设计基于多头注意力模块Fastformer的全局特征提取模块GlobalBlock,以更好地捕捉整个语音样本的全局信息,获得丰富的设备特征信息;其次,设计基于SE-Res2Block(Squeeze-Excitation Res2Block)的局部特征提取模块LocalBlocks,专注于增强跟手机信息相关的特征,抑制与手机来源识别无关的特征;随后,设计基于注意力机制的特征融合机制,将全局特征和多层局部特征深度融合;最后,设计基于注意力池化的手机来源确认网络,以提高开集模式下的识别准确率。在13个不同手机品牌、86种不同型号的手机语音数据集上的对比实验结果表明,所提方法可以实现未知类别手机的识别,为语音手机来源的开集识别提供可参考的技术方案。

    基于多图神经网络和图对比学习的科学文献摘要模型
    赵红燕, 郭力华, 刘春霞, 王日云
    2025, 45(12):  3820-3828.  DOI: 10.11772/j.issn.1001-9081.2024121751
    摘要 ( )   HTML ( )   PDF (795KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    长文档摘要生成面临句间关系的捕捉、长距离依赖及文档信息的高效编码与提取等难题,一直是自然语言处理领域的一个难点任务。同时,科学文献通常包含多个章节和段落,具有复杂的层次结构,使科学文献的摘要生成任务更具挑战性。针对以上问题,提出一种基于多图神经网络(GNN)和图对比学习(GCL)的科学文献摘要模型(MGCSum)。首先,对于输入的文档,通过同构GNN和异构GNN分别建模句内与句间关系,以生成初始句子表示;其次,将这些句子表示馈送到一个多头超图注意网络(HGAT),并在其中利用自注意机制充分捕捉节点和边之间的关系,从而进一步更新和学习句间的表示;再次,引入GCL模块增强全局主题感知,从而提升句子表示的语义一致性和区分度;最后,采用多层感知器(MLP)和归一化层计算一个得分,用于判断句子是否应被选为摘要。在PubMed和ArXiv数据集上的实验结果表明,MGCSum模型的表现优于多数基线模型。具体地,在PubMed数据集上,MGCSum模型的ROUGE-1、ROUGE-2和ROUGE-L分别达到了48.97%、23.15%和44.09%,相比现有的先进模型HAESum (Hierarchical Attention graph for Extractive document Summarization)分别提高了0.20、0.71和0.26个百分点。可见,通过结合多GNN和GCL,MGCSum模型能够更有效地捕捉文献的层次结构信息和句间关系,提升了摘要生成的准确性和语义一致性,展现了它在科学文献摘要生成任务中的优势。

    基于语言学多重不一致性的隐喻检测模型
    郑天龙, 董瑞, 杨雅婷, 马博, 王磊, 周喜
    2025, 45(12):  3829-3838.  DOI: 10.11772/j.issn.1001-9081.2024121797
    摘要 ( )   HTML ( )   PDF (1388KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有隐喻检测研究忽略了目标词在特定语境中存在多种语义(一词多义)时目标语句句义和目标词基本义不一致引起的隐喻发生问题,提出一种基于语言学多重不一致性的隐喻检测模型。首先,在特征编码模块,使用2个独立的编码器编码目标语句句义、目标词基本义和语境义等特征信息;其次,在多重不一致性建模模块,使用选择偏好违背(SPV)、隐喻识别程序(MIP)和语义用法对比(SUC)这3个语言学方法对多重不一致性特征进行统一建模;最后,利用隐喻识别模块进行隐喻检测。此外,通过LoRA(Low-Rank Adaptation)微调的大语言模型(LLM)和人工矫正结合的数据标注方法构建一个中文词级隐喻检测数据集META-ZH,以验证中文隐喻检测性能。实验结果表明,所提模型在VUA All、VUA Verb、MOH-X和META-ZH隐喻检测数据集上,对比最优基线模型,F1值分别提升了0.8、1.3、1.5和2.3个百分点。可见,该模型能够充分利用语言学多重不一致性有效提高隐喻检测性能。

    基于元权重网络的鲁棒性文本匹配方法CovMW-net
    张东伟, 叶正, 葛君
    2025, 45(12):  3839-3846.  DOI: 10.11772/j.issn.1001-9081.2024121841
    摘要 ( )   HTML ( )   PDF (719KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在文本匹配任务中,文本数据的复杂性与多样性使训练时常暴露出鲁棒性欠佳的问题。传统的解决文本鲁棒性不足的手段,诸如数据增强和正则化等,虽能发挥一定作用,但这些方法大多仅适用于特定类型的噪声或扰动,并且对计算资源的需求较高。因此,提出一种基于元权重网络(MW-net)的方法——协方差矩阵改进的元权重网络(CovMW-net)。首先,通过自适应学习调整权重参数与损失函数,从而迅速实现较合理的权重分配。其次,借助对样本权重的调控,放大或缩小样本在训练过程中对训练效果的影响,最终实现提升训练鲁棒性的目的。CovMW-net继承MW-net的元学习框架,进而节约计算资源。同时,它融合协方差矩阵,针对每个类别的样本开展深度特征提取,计算这些特征的协方差矩阵,并以此度量少数类数据,进而削减MW-net因为元数据集随机取样而产生长尾分布所造成的负面影响。在Clothing1M数据集上的实验结果表明,CovMW-net在准确率上超过原始方法MW-net 0.86个百分点,并优于所有对比方法。此外,在大规模中文问题匹配语料库(LCQMC)和百度问答匹配数据集(BQ)上CovMW-net的准确率相较于baseline提升大多在4~6个百分点。可见,CovMW-net在处理元数据集存在偏差时具备有效性,且应用于文本匹配鲁棒性研究时具有可行性。

    融合特征增强和对比学习的电力客服工单多标签文本分类方法
    周景, 唐振洋, 董晖, 刘心
    2025, 45(12):  3847-3854.  DOI: 10.11772/j.issn.1001-9081.2024121747
    摘要 ( )   HTML ( )   PDF (1371KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    电力客服工单多标签文本分类(MLTC)在提升服务效率与用户满意度方面具有重要意义。针对电力客服工单MLTC中的标签关系建模不足与类别不平衡问题,提出一种融合特征增强和对比学习的电力客服工单MLTC方法。首先,通过预训练语言模型提取客服工单文本特征;其次,结合多头注意力机制的全局编码与卷积神经网络(CNN)的局部编码模块,设计一种文本特征增强方法,以有效捕捉电力工单文本中的重要信息并提升特征表达能力;最后,引入对比学习改进的K最近邻(KNN)算法的MLTC框架,采用R-Drop (Regularized Dropout)方法生成正样本,而对负样本重新加权,并在训练中结合监督对比学习损失函数提高KNN机制推理期间检索到的邻居的质量,从而有效地缓解样本不平衡带来的负面影响。实验结果表明,所提方法在电力客服工单数据集上的微平均F1值为92.17%,较BERT(Bidirectional Encoder Representations from Transformers)模型提高了1.62个百分点;同时,所提方法在MLTC公共数据集AAPD和RCV1-V2上分别取得了75.2%和88.5%的微平均F1值,不仅在提升工单处理准确性和服务效率方面展现出较高的应用价值,而且在复杂MLTC任务中具备有效性。

    数据科学与技术
    基于多层感知器的高频增强型时间序列预测模型
    朱昶胜, 杨琛, 冯文芳, 袁培文
    2025, 45(12):  3855-3863.  DOI: 10.11772/j.issn.1001-9081.2024121818
    摘要 ( )   HTML ( )   PDF (1361KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    简单线性模型的时间序列预测质量通常超过Transformer等深度模型;而在具有大量通道的数据集上,深度模型尤其是多层感知器(MLP)的性能反而可超过简单线性模型。针对简单线性模型和MLP在时间序列预测中的误差功率谱差异,提出一种基于MLP的高频增强型时间序列预测模型HiFNet(High-Frequency Network)。首先,利用MLP在低频段的拟合能力;其次,通过自适应序列分解(ASD)模块及分组线性层解决MLP高频段易过拟合以及通道独立策略不能有效应对通道冗余的问题,从而增强MLP在高频段的鲁棒性;最后,对HiFNet在气象、电力和交通等领域的标准数据集上进行实验。结果表明:HiFNet的均方误差(MSE)在最佳情况下相较于NLinear、RLinear、SegRNN(Segment Recurrent Neural Network)和PatchTST(Patch Time Series Transformer)分别降低了23.6%、10.0%、35.1%和6.5%,而分组线性层通过学习通道相关性的低秩表达减轻了通道冗余的影响。

    基于累积概率波动和自动化聚类的异常检测方法
    曾君, 童英华, 王得芳
    2025, 45(12):  3864-3871.  DOI: 10.11772/j.issn.1001-9081.2024121792
    摘要 ( )   HTML ( )   PDF (1735KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着多维数据特征的复杂性不断增加,现有的异常检测方法在捕捉特征分布方面表现出局限性,同时传统的聚类和统计方法在参数选择上遇到了更大的挑战,这些共同导致了检测性能的提升受到限制。针对上述问题,提出一种基于累积概率波动和自动化聚类的异常检测方法。首先,计算特征的累积概率波动以表征特征的高斯混合分布,并根据累积概率波动值对特征进行压缩变换;其次,在基于密度的噪声应用空间聚类(DBSCAN)中利用深度强化学习寻找最优聚类参数,并对压缩变换后的数据集进行聚类;最后,综合数据的聚类结果与数据特征的累积概率波动值判断数据点是否异常。实验结果表明,所提方法在6个实验数据集上的平均精确率、召回率、F1分数和受试者工作特征曲线下面积(AUC)相较于对比方法中表现最好的方法分别提升了36.39%、2.73%、14.90%和4.84%可见,所提方法在无需手动选择参数的情况下,有效提高了对多维复杂特征数据异常检测的综合性能。

    网络空间安全
    区块链技术在碳排放交易系统中的应用综述
    魏境烽, 姚中原, 马硕森, 王超, 郭尚坤, 朱自强, 斯雪明
    2025, 45(12):  3872-3880.  DOI: 10.11772/j.issn.1001-9081.2024121837
    摘要 ( )   HTML ( )   PDF (656KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对碳排放交易(CET)中的交易透明性不足、数据安全性较差和市场效率低等问题,对区块链技术在CET系统中的优化方法进行综述。首先,综述区块链技术在CET中的具体应用,包括关键技术和主要贡献;其次,深入分析碳排放管理和交易面临的挑战,如数据隐私保护和系统扩展性等问题,并探讨区块链技术的改进方法;再次,研究区块链与物联网(IoT)技术的集成应用,以实现碳排放数据的实时采集与安全存储;最后,探讨博弈论在CET策略制定中的应用,以及区块链技术在碳资产管理中的创新实践。研究表明,区块链技术能够显著提升CET系统的数据透明性和安全性,减少人为干预,降低交易成本,并提高市场效率。然而,当前系统仍面临性能、隐私保护和监管适配等挑战。综上,区块链技术在CET系统中的应用不仅有助于提高系统的透明度、安全性和效率,还为全球碳减排目标的实现提供了可靠的技术支撑。

    基于一次性环签名的区块链混币方案
    陈依林, 李晓宇
    2025, 45(12):  3881-3887.  DOI: 10.11772/j.issn.1001-9081.2024121768
    摘要 ( )   HTML ( )   PDF (650KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对当前区块链混币系统在保护用户交易隐私的同时存在的难以抵御用户重复转账攻击、混币中心泄露信息和伪造转账攻击等问题,提出一种基于一次性环签名的区块链混币方案。首先,用户向混币中心存款并请求加入环组;其次,在混币中心验证通过后用户使用一次性环签名申请转账;最后,混币中心对签名和转账指令进行验证并转账。一次性环签名的性质使混币中心只能确认签名是否来自用户环组内,而无法获知具体来自哪位用户,且一次性环签名只能被验证一次,因此在保护用户隐私的同时使得用户无法重复发送转账指令,且混币中心也无法伪造转账指令。此外,用户和混币中心之间的通信使用混合加密技术,从而有效地防止第三方攻击者破坏签名的发送/验证并获取交易隐私。实验结果显示,该方案的平均响应时间随用户数量增多呈线性增长,每增加10个用户响应时间约增加10 ms,不会出现用户数量增长导致系统性能急剧下降甚至系统瘫痪的情况,可以支持混币网络中的多个用户在保护交易隐私的前提下高效顺利地完成转账。在用户数量相同的情况下,该方案的响应时间与CoinJoin相比缩短了约60 ms,和CoinShuffle方案相比缩短了约80 ms,与Blindcoin和Blindmixing方案相比响应时间相差不大但具有实现简单和安全性高等优点。可见,该方案在保护区块链用户隐私及财产安全方面具有实践及应用价值。

    基于联邦类原型增量学习的加密流量分类方法
    陈瑞龙, 伊鹏, 胡涛, 卜佑军
    2025, 45(12):  3888-3895.  DOI: 10.11772/j.issn.1001-9081.2024111702
    摘要 ( )   HTML ( )   PDF (1069KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    深度学习目前已经广泛应用于加密流量分类,然而它仍面临诸多挑战,例如用户数据隐私保护和持续学习能力等。针对上述问题,提出一种基于联邦类原型增量的加密流量分类方法(FPI-ETC)。在客户端本地模型训练阶段,将本地模型的Softmax分类器替换为原型分类器,以解决Softmax分类器造成的预测偏见问题。在新任务阶段,客户端利用旧类原型向量生成多个旧类范例,以避免本地模型遗忘过去的知识;服务器端加权聚合客户端上传的类原型向量,以实现类原型的迭代更新。实验结果表明,在客户端任务量为5且采样率为0.6时,FPI-ETC在ISCX VPN-nonVPN数据集上的最终全局精度相较于现有方法提升了9.93~33.45个百分点,在USTC-TFC2016数据集上的最终全局精度相较于现有方法提升了5.06~10.92个百分点,验证了FPI-ETC在动态更新的加密网络环境中能有效解决灾难性遗忘问题。

    基于自适应扰动的网络防测绘方法
    王诚熠, 徐磊, 陈晋音, 邱洪君
    2025, 45(12):  3896-3908.  DOI: 10.11772/j.issn.1001-9081.2024121733
    摘要 ( )   HTML ( )   PDF (1770KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于深度强化学习(DRL)的智能化网络测绘方法将网络测绘过程建模为马尔可夫决策过程(MDP),利用试错学习的方式训练攻击智能体以识别关键网络路径,获取网络拓扑信息。然而,传统的网络防测绘方法通常基于固定的规则,难以应对DRL智能体在测绘过程中不断变化的行为策略。因此,提出一种基于自适应扰动的网络防测绘方法,即AIP (Adaptive Interference Perturbation),旨在抵御智能化网络测绘攻击。首先,通过历史流量序列信息预测流量状况,根据预测的状况与真实流量数据的差异获取梯度信息,且使用梯度信息生成的对抗扰动返回原始流量样本中生成对抗样本;其次,采用融合流量态势-路由状态的特征重构方法通过迭代实现对稀疏字典的动态优化,进而完成对流量数据的稀疏变换;最后,将稀疏化后的对抗流量作为网络拓扑的可观测流量信息,并通过分析测绘智能体在网络拓扑链路权重分配上的变化和网络时延的差异评估AIP方法的防御性能。实验结果表明,与传统的扰动防御方法如快速梯度符号法(FGSM)和随机攻击(RA)相比,当网络中的流量强度大于25%时,AIP对攻击者的干扰效果更显著,从而导致网络拓扑中链路权重的变化幅度加大,并显而易见地影响网络时延;与静态蜜罐部署(SHD)和基于Q-Learning的动态蜜罐部署(DHD-Q)方法相比,根据延迟趋势对比结果,AIP可持续干扰攻击者,使攻击者难以发现网络中的关键路径,从而有效控制网络时延波动,在防御效率与稳定性方面具有更优的表现。

    多阶段融合的医疗物联网入侵检测方法
    郑浩群, 蔡立志, 杨康, 王晓宇
    2025, 45(12):  3909-3915.  DOI: 10.11772/j.issn.1001-9081.2024121844
    摘要 ( )   HTML ( )   PDF (822KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对医疗物联网(IoMT)入侵检测方法依赖数据样本的平衡性,采用有监督学习的误用检测无法应对未知攻击,而采用无监督学习的异常检测误报率高的问题,提出一种多阶段融合的IoMT入侵检测方法。首先,采用双向流特征中加入包头信息和有效载荷的特征提取方法,减少对数据样本平衡性的依赖;其次,结合有监督和无监督学习方法设计一个三阶段的入侵检测框架,即通过无监督学习的自编码器(AE)模型过滤出良性流量并检测未知攻击,而通过有监督学习的卷积神经网络(CNN)、门控循环单元(GRU)和注意力机制(Attention)的混合模型检测已知攻击减少误报,从而提高检测性能。实验结果表明,所提方法构建的多阶段医疗物联网入侵检测系统(MTIDS)在CICIoMT2024和CICIoT2023数据集上实现了99.96%的检测准确率和93.78%的F1值,相较于AE等单一有监督或无监督学习方法的入侵检测模型,均有提高,其中,MTIDS在准确率和F1值上比对比模型中最优的AE分别提升了0.82和5.58个百分点,验证了所提方法在已知和未知攻击检测方面的准确性。

    先进计算
    面向算力网络的工作流任务优化与节能卸载方法
    卫琳, 张世豪, 和孟佯
    2025, 45(12):  3916-3924.  DOI: 10.11772/j.issn.1001-9081.2024111676
    摘要 ( )   HTML ( )   PDF (1230KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在算力网络(CPN)中,用户设备(UE)因计算能力和电源容量受限,需要依赖外部算力节点协同处理任务。现有研究多集中于直接卸载工作流任务(WT)上,而面临着以下关键挑战:1)任务依赖导致的长等待时延和高能耗问题;2)当前驱任务数据需在UE上缓存时,UE长时间处于高功耗状态;3)CPN动态环境下资源状态的不确定性增加了卸载决策的复杂性;4)任务完成时间与能耗之间的多目标冲突,导致难以实现高效平衡。针对这些问题,提出一种基于动态任务优化与卸载(DOOWT)的节能优化方法。该算法通过工作流结构优化(WSO)算法对任务图进行重排,以减少任务间的等待时延,从而降低整体能耗;结合基于深度确定性策略梯度(DDPG)的动态任务卸载(DBTO)算法实时调整卸载策略,从而有效提升CPN的计算性能和资源利用效率。实验结果表明,与随机卸载(Random)传统方法相比,所提方法的WT等待时延减少了60%,平均WT完成时延缩短了79%,整体能耗降低了82%。可见,该方法为能耗敏感型任务的优化与调度提供了理论支持与技术参考。

    基于凌日搜索算法优化的组合预测模型
    姚军, 刘明
    2025, 45(12):  3925-3930.  DOI: 10.11772/j.issn.1001-9081.2024121756
    摘要 ( )   HTML ( )   PDF (3534KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对云平台资源调度面临的资源浪费和性能挑战,尤其是长短期记忆(LSTM)网络模型的超参数人工选值困难导致的云资源预测精度不足的问题,提出一种基于凌日搜索(TS)算法优化的组合预测模型TS-ARIMA-LSTM。该组合预测模型为差分自回归移动平均(ARIMA)模型和LSTM模型结合。首先,使用TS算法对LSTM模型的超参数进行寻优,包括3层神经元数和滞后值;其次,使用寻优后的LSTM模型进行初步预测,并使用ARIMA模型修正LSTM预测的误差;最后,将ARIMA模型和LSTM模型的预测结果结合得到最终的预测值。在阿里云公开数据集Cluster-trace-v2018上的实验结果显示,相较于传统的单一预测模型ARIMA和LSTM,以及组合预测模型ARIMA-LSTM,基于TS算法优化的所提模型在预测精度上有显著提升,具体表现为:与基线最优的ARIMA-LSTM模型相比,所提模型的均方误差(MSE)减小了49.72%,均方根误差(RMSE)减小了29.24% ,而平均绝对误差(MAE)减小了33.94%。可见,该模型在云资源预测中的应用展现了较高的预测精度,为改善云平台的任务调度策略提供了新路径。

    网络与通信
    基于自适应梯度匹配追踪算法的超大规模多输入多输出混合场信道估计
    刘占军, 宋云鹏, 王盛宝
    2025, 45(12):  3931-3938.  DOI: 10.11772/j.issn.1001-9081.2024121805
    摘要 ( )   HTML ( )   PDF (856KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对第六代无线通信技术(6G)网络中超大规模多输入多输出(XL-MIMO)系统在混合场信道估计中面临的高复杂度和低精度问题,提出一种自适应梯度匹配追踪(AGMP)算法。首先,利用角域变换矩阵估计远场分量,并利用极域变换矩阵估计近场分量,从而将信道估计问题转化为稀疏重构问题;其次,在估计分量的过程中,采用最小均方(LMS)算法,并结合自适应梯度搜索策略,通过动态调整步长参数优化路径分量估计,并迭代逼近最小均方误差(MMSE)目标,从而优化信道估计过程;最后,通过角域和极域变换矩阵重建整个混合场信道,从而完成混合场信道的精确估计。仿真实验结果表明,在低信噪比(SNR)环境下,与正交匹配追踪(OMP)算法相比,所提算法的可达速率提升了约20.46%。此外,随着用户设备(UE)天线数量的增加,在多天线环境下,所提算法的归一化均方误差(NMSE)相较于OMP算法降低了约1.2 dB。可见,所提算法在低SNR和多天线UE环境下能获得更好的估计性能。

    基于多阶段传播的区块链网络低延迟邻居选择方案
    李功丽, 陈晓迪, 李露
    2025, 45(12):  3939-3946.  DOI: 10.11772/j.issn.1001-9081.2024111678
    摘要 ( )   HTML ( )   PDF (793KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    区块链基于非结构化的点对点(P2P)覆盖网络传播交易和区块。在这种网络结构上,传播具有延迟性且传播的长尾问题显著,而这些会导致节点存储信息的不一致,即区块链的分叉现象。分叉不仅浪费了整个区块链网络的算力资源,还带来了一系列的安全问题。为了减少区块链网络的传播延迟,提出一种基于多阶段传播的邻居选择方案(NSMP),通过邻居节点的选择优化网络拓扑结构。首先,根据传播能力和邻近度两个因素,将节点Outbound邻居分为强传播和弱传播两部分,并针对网络传播的不同阶段应用不同的邻居选择方案,从而减少传播跳跃和缩短传播时间;并且,进一步解决现有方案和默认方案都存在的传播长尾问题;最后,根据节点局部特征的拟合函数量化节点的传播能力,通过Ping协议量化节点的邻近度信息,并使用网络模拟器SimBlock对设计的方案进行模拟实验。实验结果表明,NSMP比默认方案的分叉率降低了52.17%,验证了NSMP的可行性和有效性。此外,根据实验模拟数据,确定了邻居节点邻近度远近分配的最佳参数设置。

    基于编解码结构强化学习的安全可靠服务功能链部署
    况翔, 马震, 朱万春, 张智, 崔云飞
    2025, 45(12):  3947-3956.  DOI: 10.11772/j.issn.1001-9081.2024111677
    摘要 ( )   HTML ( )   PDF (1035KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了在云计算中高效分配有限的网络资源以确保服务质量(QoS),并且同时提高资源利用率和管理效率,提出一种安全可靠性驱动的基于编解码的深度强化学习(ED-DRL)方法用于服务功能链(SFC)部署。该方法将SFC部署看作一个马尔可夫决策过程(MDP),采用图注意力网络(GAT)编码器和门控循环单元(GRU)解码器高效提取网络拓扑特征和节点间的依赖关系,并结合异步优势Actor-Critic(A3C)算法实现SFC部署策略的动态生成。针对安全可靠性的需求,重设计奖励函数,从而引导策略网络选择最优资源。仿真结果表明,ED-DRL能获得70.7%的接受率与0.063 5的平均收益,优于连续决策强化学习(CDRL)等对比方法。

    多媒体计算与计算机仿真
    基于自适应特征提取和特征融合的点云滤波
    李维刚, 王栋, 王永强, 李金灵
    2025, 45(12):  3957-3963.  DOI: 10.11772/j.issn.1001-9081.2024111617
    摘要 ( )   HTML ( )   PDF (2618KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有滤波方法在处理具有高复杂度几何结构的点云模型中存在特征模糊现象,导致最终滤波效果较差的问题,设计一种基于自适应特征提取和特征融合策略的点云滤波网络PFRNet(Point cloud Feature Regularization fusion Network)。首先,通过自适应空间特征提取器学习不同邻域之间的特征信息,从而捕获不同维度的局部邻域特征,减少局部细节的丢失;其次,通过局部特征正则化融合从点云的局部信息中引入全局双线性响应,并对它进行正则化融合,削弱点云的共性特征,增强尖锐特征;最后,通过自相关注意力解码器在解码过程中增强不同邻域之间的联系,提升模型的全局感知能力,以更好地提取局部几何特征。实验结果表明,与Pointfilter相比,PFRNet的倒角距离(CD)和均方误差(MSE)分别降低了7.45%、4.99%;可视化结果显示,PFRNet相较于其他方法能够生成更接近真实的点云模型。

    基于马氏距离结合吉布斯-马尔可夫随机场空间滤波的高光谱波段选择算法
    袁博, 黄宪通
    2025, 45(12):  3964-3970.  DOI: 10.11772/j.issn.1001-9081.2024121732
    摘要 ( )   HTML ( )   PDF (813KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对作物种植区域的高光谱遥感图像波段选择中规则纹理特征挖掘不足导致分类精度受限的问题,提出一种基于马氏距离结合吉布斯-马尔可夫随机场(GMRF)空间滤波的波段选择算法。首先,针对作物种植区域普遍存在的规则纹理特征,通过建立GMRF模型对高光谱图像进行空间滤波,从而在降低噪声和冗余信息的同时保留并强化纹理特征,并增强地物之间的特征差异;其次,基于马氏距离和比值法建立类别可分性度量指标,计算每个波段对该指标的贡献值,并依据贡献值大小进行波段排序,从而选择排序靠前的指定数量波段作为算法输出。采用包含大量作物种植区域的Indian Pines高光谱数据集进行波段选择和最大似然分类实验,结果表明,相较于遗传算法、连续投影法和峰值聚类法这3种参考算法中的最优性能指标,该算法的平均相关性、总体分类精度和Kappa系数分别改善了3.37%、2.90%和6.70%。可见,该算法有效融合了作物空间纹理与光谱协方差特征,为精准农业中的作物分类与长势监测提供了具有明确物理解释性的特征选择方案。

    基于梯度增强和文本引导的光照自适应图像融合算法
    魏超, 叶威, 盛光健, 张蕾
    2025, 45(12):  3970-3977.  DOI: 10.11772/j.issn.1001-9081.2024111619
    摘要 ( )   HTML ( )   PDF (5081KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有融合算法在复杂多变光照环境下存在的细节信息丢失、边缘退化和显著信息不明显等问题,提出一种基于梯度增强和文本引导的光照自适应图像融合算法。首先,构建基于梯度增强与线性空间方程的特征提取模块,在实现线性复杂度全局特征提取的同时增强边缘梯度信息;其次,通过嵌入场景描述文本引导融合网络在不同光照环境下生成不同风格的融合图像,提升了融合算法在复杂光照环境下的鲁棒性;最后,构建一种结合交叉注意力机制的梯度增强融合模块(GEFM),实现对多模态信息的梯度增强与融合。在3个公开数据集TNO、MSRS(MultiSpectral Road Scenarios)和LLVIP(Low-Light Visible-Infrared Paired)上的实验结果表明,所提算法相较于对比算法LRRNet(Low-Rank Representation Network)、CAMF(Class Activation Mapping Fusion)、DATFuse(Dual Attention Transformer Fusion)、UMF-CMGR(Unsupervised Misaligned Fusion via Cross-Modality image Generation and Registration)和GANMcC(GAN with Multi-classification Constraints)在5种评价指标均有所提高,其中空间频率(SF)和视觉信息保真度(VIF)指标分别提高了22%、59%、61%和31%、53%、37%,有效地减少了边缘模糊,而且融合图像在不同光照环境下都具有较高的清晰度和对比度。

    基于信息补偿的全景图像超分辨率重建网络
    范宇, 陈纯毅, 胡小娟, 李延风, 于海洋, 张日培, 刘云彪
    2025, 45(12):  3978-3986.  DOI: 10.11772/j.issn.1001-9081.2024111684
    摘要 ( )   HTML ( )   PDF (3226KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    全景图像因投影形式特殊,存在严重的几何扭曲。现有2D图像超分辨率网络未考虑全景图像的几何扭曲特性,因此并不适用于全景图像的超分辨重建。与2D超分辨网络不同,全景图像超分辨模型需要关注不同纬度区域的特征差异,而且需要解决对不同尺度特征捕获不足和上下文信息未充分学习等问题。针对上述问题,提出一种基于信息补偿的全景图像超分辨率重建网络(ICPSnet)。首先,根据全景图像的几何特性引入位置感知机制,通过计算每个像素在纬度方向上的位置权重增强模型对不同纬度区域的关注;其次,为了解决不同尺度特征捕获不足的问题,设计一种跨尺度协同注意力(CSCA)模块,该模块利用不同感受野的多核卷积注意力机制获取丰富的跨尺度特征;此外,设计信息补偿(IC)块,通过改进空洞空间金字塔池化(ASPP),增强网络的上下文信息学习能力,从而提高重建图像质量。在2种基准数据集ODI-SR和SUN360上的实验结果表明,在放大因子为4倍、8倍时,ICPSnet的加权球面均匀信噪比(WS-PSNR)比当前最先进的OSRT(Omnidirectional image Super-Resolution Transformer)分别提高了0.14 dB、0.64 dB和0.25 dB、0.26 dB。可见,相较于其他网络,ICPSnet在视觉效果上表现更加优异,它重建的图像能够更好地展现高纬度区域的纹理细节。

    多尺度特征融合的高质量声呐图像生成方法
    黄靖, 彭鑫, 李文豪, 胡凯, 王腾, 黄亚敏, 文元桥
    2025, 45(12):  3987-3994.  DOI: 10.11772/j.issn.1001-9081.2024121742
    摘要 ( )   HTML ( )   PDF (2757KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    由于声呐图像成像原理本身的特点和复杂水下环境的干扰,水下声呐图像普遍存在分辨率不足和目标细节缺失的问题。针对这些问题,提出一种多尺度特征融合的高质量声呐图像生成方法。首先,通过残差密集连接模块(RDB)在浅层提取图像特征,以捕捉基本纹理与轮廓信息,并建立图像的空间布局;其次,设计多尺度注意力特征提取模块(MSA)自适应地聚焦不同尺度下的关键特征,并通过注意力机制在进一步增强关键特征表达的同时抑制冗余信息表达;最后,以基于谱归一化的逐像素判别策略构建判别器网络,从而提升复杂物体边缘和细节的重建能力。在水下声呐图像数据集上的实验结果表明,所提方法相较于现有代表性方法ESRGAN (Enhanced Super-Resolution Generative Adversarial Network)在峰值信噪比(PSNR)和结构相似性(SSIM)指标上分别取得了6.7%和5.4%的提升。可见,所提方法在水下声呐图像数据集上有效提升了生成效果。

    基于显著性特征与交叉注意力的无参考图像质量评价算法
    邓旸, 赵涛, 孙凯, 童同, 高钦泉
    2025, 45(12):  3995-4003.  DOI: 10.11772/j.issn.1001-9081.2024121866
    摘要 ( )   HTML ( )   PDF (1393KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    实际业务场景中的图像数据通常呈现内容丰富和失真表现复杂的特点,对客观图像质量评价(IQA)算法的泛化是一个巨大挑战。针对这一问题,提出一种无参考IQA(NR-IQA)算法。该算法主要由特征提取网络(FEN)、特征融合网络(FFN)和自适应预测网络(APN)这3个子网络组成。首先,将样本的全局视图、局部patch和显著性视图一并输入FEN,并通过Swim Transformer提取全局失真、局部失真和显著性特征;其次,采用级联的Transformer编码器融合全局失真特征和局部失真特征,并挖掘二者的潜在关联模式;受人类视觉关注机制的启发,在FFN中使用显著性特征激发注意力模块,使该模块对视觉显著性区域施加额外关注,从而提升算法的语义解析能力;最后,通过动态构建的多层感知机(MLP)回归网络计算出预测分数。在主流的合成失真和真实失真数据集上的实验结果表明,所提算法与DSMix(Distortion-induced Sensitivity map-guided Mixed augmentation)算法相比,所提算法在TID2013数据集上的斯皮尔曼秩序相关系数(SRCC)提升了4.3%,在KonIQ数据集上的皮尔森线性相关系数(PLCC)提升了1.4%,并展现出了出色的泛化能力和可解释性,能够有效应对业务场景中失真表现复杂的情况,且可以根据样本个体特征做出适应性预测。

    轻量且高精度增强的姿态检测网络HG-YOLO
    崔家礼, 刘永基, 李子贺, 郑瀚
    2025, 45(12):  4004-4011.  DOI: 10.11772/j.issn.1001-9081.2024121819
    摘要 ( )   HTML ( )   PDF (940KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在人体姿态检测任务中,现有的深度学习网络存在检测精度不足、网络参数复杂和计算成本高等问题,严重限制了它们的应用。为了解决这些问题,提出一种轻量且高精度的姿态检测改进网络HG-YOLO (High-precision and Ghost YOLO)。针对检测精度不足的问题,在HG-YOLO的主干网络,融合基于Transformer的检测网络RT-DETR (Real-Time DEtection TRansformer),并将大型可分离核注意力(LSKA)模块嵌入主干网络中,以在不增加内存占用和计算复杂性的基础上,提高网络应对复杂场景的特征提取能力,从而提高人体姿态的检测精度。针对网络参数复杂和计算成本高的问题,引入轻量化的Ghost卷积模块替换部分标准卷积,此外,在HG-YOLO的检测头部分,设计一种共享卷积检测头,以通过参数和权重共享机制减少卷积计算,从而降低网络的参数量和计算复杂度。在COCO (Common Objects in COntext) 2017-Keypoints数据集和CrowdPose数据集上的实验结果表明,与基准的YOLOv8-Pose网络相比,HG-YOLO的参数量减少了32%,浮点运算量减少了18%;在规模为小型(s)时,在COCO 2017-Keypoints数据集上,AP50 (Average Precision at OKS (Object Keypoint Similarity) of 0.50)提升了0.8个百分点,在CrowdPose数据集上,AP提升了2.9个百分点。可见,HG-YOLO不仅轻量,而且检测精度高,是人体姿态检测领域的优秀网络模型。

    基于掩码提示和注意力的手部姿态估计
    任建华, 曹佳惠, 贾迪
    2025, 45(12):  4012-4020.  DOI: 10.11772/j.issn.1001-9081.2024111715
    摘要 ( )   HTML ( )   PDF (2368KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    手部姿态估计是计算机视觉的重要研究方向,传统方法易受复杂背景干扰,而深度学习方法虽具抗干扰能力,但在多手场景和细节识别方面仍存不足。因此,提出一种基于掩码提示和注意力机制的手部姿态估计方法HMCA(Hand Mask Prompts and Attention)。首先,利用目标检测和语义分割生成手部掩码图,从而屏蔽背景噪声并提供先验信息;其次,设计并行注意力模块(PAB)与多路残差模块(MRB),以提取多尺度特征,从而提高复杂手势识别能力,降低计算复杂度,并防止梯度消失;再次,利用掩码图引导模型关注手部区域,从而解决多手和遮挡问题;最后,在回归损失中加入惩罚项,从而约束关键点预测并加快模型收敛。实验结果表明,该方法在单手、多手和遮挡场景下均优于其他方法,在不同阈值下的曲线面积均值(AUC)和平均关节点位置误差(MPJPE)方面均取得最佳性能。在RHD(Rendered Handpose Dataset)上,该方法在不同阈值下的AUC为93.22%,MPJPE为2.15;在CMU Panoptic数据集上,该方法在不同阈值下的AUC为91.38%,手部关节点平均误差为2.06。

    基于信道先验多尺度跨轴注意YOLO的无人机视角下多尺度小目标检测算法
    肖海林, 田波, 胡彬, 孔祥婷, 吴媛媛, 马仁煜, 张中山
    2025, 45(12):  4021-4029.  DOI: 10.11772/j.issn.1001-9081.2024121811
    摘要 ( )   HTML ( )   PDF (1792KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对当前无人机(UAV)视角下小目标检测存在的准确率低问题,提出一种基于信道先验多尺度跨轴注意YOLO (CPMS-YOLO)的UAV视角下多尺度小目标检测算法。首先,在骨干网络中融入能在复杂背景下更好地提取和强化有用特征的多尺度注意力模块CPMS(Channel-Prior-Multi-Scale cross-axis attention),该模块使算法能更容易地学习感兴趣区域的位置细节并提高对不同尺度小目标在复杂背景下的特征提取能力;其次,对骨干网络和特征融合网络进行重构,即增加一个具有丰富小目标语义信息的特征层,并通过融合模块MultiSEAM(Multi-scale Separated and Enhancement Attention Module)将上下文特征信息进行互补,从而更好地捕捉和识别小目标;再次,设计C2f-RFE(C2f-Receptive Field Enhancement)模块改进颈部网络中深层的C2f(Faster Implementation of CSP Bottleneck with 2 convolutions)模块,以增加特征图的感受野,从而更准确、更快速且多角度地定位目标特征,进而提升对小目标的检测能力;最后,引入损失函数WIoUv3 (Wise-IoU(Intersection over Union) v3)动态优化小目标的损失权值,以解决边界框回归任务中正负样本之间的差异问题,从而进一步提高对小目标的检测能力。在公共数据集VisDrone2019上的实验结果表明:与基准算法YOLOv8s相比,所提算法的精确率、召回率、mAP50(mean Average Precision at IoU threshold of 50%)和mAP50-95(mean Average Precision at IoU thresholds from 50% to 95%)分别提升了5.9、5.8、6.3和3.6个百分点。可见,基于CPMS-YOLO的UAV视角下多尺度小目标检测算法能更精确地捕捉和识别小目标。

    特征融合的MV2-Transformer肺炎X光图像分类模型
    平金如, 孙子文
    2025, 45(12):  4030-4036.  DOI: 10.11772/j.issn.1001-9081.2024121745
    摘要 ( )   HTML ( )   PDF (878KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对肺炎X光图像病灶区域特征难以被提取和现有模型轻量化程度不高的问题,提出一种特征融合的MV2-Transformer(FFMV2-Transformer)肺炎X光图像分类模型。首先,采用轻量型网络MobileNetV2(Mobile Network Version 2)作为主干网络,并在反向残差瓶颈块中嵌入坐标注意力(CA)机制,从而通过将位置信息嵌入通道信息提高模型对病灶区域特征的提取能力;其次,设计局部和全局特征融合模块(LGFFM)将卷积层提取的局部特征与Transformer捕获的全局特征相结合,从而使模型能同时捕捉病灶区域的细节信息和整体信息,并进一步提高模型的语义特征提取能力;最后,设计跨层特征融合模块(CFFM)将空间注意力机制增强的浅层特征的空间信息与通道注意力机制增强的深层特征的语义信息相结合,从而获得丰富的上下文信息。为了验证模型的有效性,在肺炎X光数据集上进行消融实验和对比实验,结果表明,FFMV2-Transformer模型与MobileViT(Mobile Vision Transformer)模型相比,准确率、精确率、召回率、F1值和AUC(Area Under ROC(Receiver Operating Characteristic) Curve)值分别提高了1.09、0.31、1.91、1.08和0.40个百分点。可见,FFMV2-Transformer模型能在实现模型轻量化的同时,有效提取肺炎X光图像病灶区域的特征。

    改进TransUNet的高效通道注意力医学图像分割网络
    邓酩, 徐锦凡, 肖洪祥, 谢晓兰
    2025, 45(12):  4037-4044.  DOI: 10.11772/j.issn.1001-9081.2024111673
    摘要 ( )   HTML ( )   PDF (1903KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    医学图像分割在计算机辅助诊断和手术导航等临床应用中起着至关重要的作用,旨在从复杂的医学影像中精准提取不同器官和病灶。然而,现有的U型网络结构在实际应用中存在跳跃连接信息冗余大和计算量高等问题。为了解决这些问题,提出一种轻量化医学图像分割网络ES-TransUNet (Efficient channel attention and Simple-TransUNet)。该网络在编码器中通过引入十字交叉注意力(CCA)机制捕捉图像中的长距离依赖关系,并优化Transformer中的多头注意力结构,从而使模型轻量化,在解码器中引入动态上采样(Dysample)模块提升上采样效率;同时为了减少跳跃连接中的信息冗余,引入简单上下文Transformer(SCOT)块对冗余特征进行过滤。在Synapse多器官分割和ACDC数据集上的实验结果表明,ES-TransUNet相比TransUNet分别取得了2.37和1.57个百分点的Dice相似系数(DSC)提升,并在Synapse数据集上使Hausdorff距离(HD)降低了约9.69。此外,所提网络与现有最先进的医学分割模型的对比结果表明,ES-TransUNet在保持较高分割精度的基础上,显著降低了模型的参数量和计算复杂度,并提高了推理效率。可见,该网络更满足实时医学图像分割的实际需求。

    基于双路径注意力机制和多尺度信息融合的皮肤病灶图像分割
    王斯豪, 张笃振, 杨昌昌
    2025, 45(12):  4045-4054.  DOI: 10.11772/j.issn.1001-9081.2024111669
    摘要 ( )   HTML ( )   PDF (2248KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对皮肤病灶边界模糊、存在毛发干扰、病灶大小不一等问题,提出一种基于双路径注意力机制和多尺度信息融合的皮肤病灶分割网络。首先,在编码器部分设计基于深度可分离卷积的残差门控注意力模块DGConv(Depthwise Gate Convolution),用于捕捉病灶区域的局部信息;其次,在网络瓶颈处设计多尺度上下文关系提取模块(MCEM),采用水平平均池化及垂直平均池化建模上下文信息,并融合残差空洞卷积金字塔模块捕获的多尺度特征进一步增强对病灶全局信息的理解;再次,在跳跃连接处设计双路径注意力模块用于细化病灶信息,并利用多尺度特征融合增强(MSFE)模块实现多阶段信息的交融,丰富当前阶段传输的细节特征信息;最后,在解码器部分设计特征融合模块(FM),以解决同阶段接受野失配的问题,并逐步融合编码器输出和跳跃连接传递的特征信息得到最终的分割结果。该网络在ISIC2017(International Skin Imaging Collaboration)和ISIC2018数据集上的实验结果表明,相较于皮肤病灶分割方面表现次优的网络,所提网络的Dice指标分别提高了0.09和1.09个百分点,交并比(IoU)指标分别提高0.14和1.76个百分点;与经典U-Net相比,Dice指标分别提高5.13和3.84个百分点,IoU指标分别提高了7.74和6.04个百分点。充分说明所提网络的先进性与有效性。

    前沿与综合应用
    基于强化学习的无人机乡村末端配送任务分配
    陈晓娟, 张薇
    2025, 45(12):  4055-4063.  DOI: 10.11772/j.issn.1001-9081.2024111670
    摘要 ( )   HTML ( )   PDF (1075KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    农村“最后一公里”配送难、时间长和成本高的特点使高效精准的末端配送调度方案尤为重要。针对农村配送场景下的多物流无人机(UAV)的任务分配问题,综合考虑UAV的载重量和UAV的最大飞行距离,以最小化UAV的飞行距离、派遣数量和不违反时间窗为目标,建立多目标的UAV任务分配模型。首先,以强化学习为基础,针对任务分配维数过高的问题,引入编码器和注意力机制有效简化状态空间;其次,结合全局-局部搜索策略,在探索解空间的同时避免陷入局部最优解,从而提高求解质量;最后,进一步分析参数权重设置,并且经实验得出各子目标函数权重系数的最优组合。仿真结果表明,在得到的最终路径长度上相较于混合Q学习网络方法(HQM)、自适应大邻域搜索算法(ALNS)、Q学习算法(Q-learning)和遗传算法(GA),所提算法SG-HQM(Sine and Gaussian HQM)分别减少了8.35%、9.88%、10.29%和12.48%。

    多阶段分布适应的跨被试运动想象脑电解码模型
    何敏, 罗天健
    2025, 45(12):  4064-4072.  DOI: 10.11772/j.issn.1001-9081.2024111698
    摘要 ( )   HTML ( )   PDF (1157KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    运动想象脑电(MI-EEG)信号在无创脑机接口(BCI)中扮演重要角色,已被广泛应用于临床辅助康复训练。作为一个主动刺激范式,MI-EEG的样本采集成本高且个体差异大,同时具有复杂时变性和低信噪比等特点,使得构建跨被试MI-EEG解码模型成了研究关键。然而,当前绝大多数的跨被试解码模型采用单阶段的对抗学习策略,并且仅考虑学习边缘分布或条件分布最小化的深度表征,进而严重制约了MI-EEG解码性能。因此,提出一种多阶段分布适应(MSDA)的跨被试MI-EEG解码模型。首先,采用样本协方差对齐被试者之间的样本边缘分布差异;其次,通过预训练特征提取器和域鉴别器获取边缘分布不变的深度表征;最后,通过L2距离构建深度表征的联合分布不变映射,并交替训练联合这些映射和分类器学习联合分布不变的深度表征用于跨被试MI-EEG解码。MSDA模型分别从样本边缘分布、深度表征边缘分布和深度表征联合分布这3个阶段进行被试者之间的分布适应,从而有效地应对单阶段分布适应的挑战。在BCI Competition IV-2a和BCI Competition IV-2b公开数据集上的实验结果表明,MSDA模型在准确率和Kappa系数这2个指标均超越了近期提出的解码模型。可见, MSDA模型提升了跨被试域不变深度特征的学习能力,为构建MI-BCI提供了新的选择。

2025年 45卷 11期
刊出日期: 2025-11-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会