当期目录

    2025年 第45卷 第1期 刊出日期:2025-01-10 封面下载 目录下载
    人工智能
    联邦学习的公平性综述
    张淑芬, 张宏扬, 任志强, 陈学斌
    2025, 45(1):  1-14.  DOI: 10.11772/j.issn.1001-9081.2023121881
    摘要 ( )   HTML ( )   PDF (907KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    联邦学习(FL)凭借分布式结构和隐私安全的优势快速发展,但大规模FL引发的公平性问题影响了FL系统的可持续性。针对FL的公平性问题,对近年FL公平性的研究工作进行了系统梳理和深度分析。首先,对FL的工作流程和定义进行了解释,总结了FL中的偏见和公平性概念;其次,详细归纳了FL公平性研究中常用的数据集,探讨了公平性研究所面临的挑战;最后,从数据源选择、模型优化、贡献评估和激励机制这4个方面归纳梳理了相关研究工作的优缺点、适用场景以及实验设置等,并展望了FL公平性未来的研究方向和趋势。

    基于有向超图自适应卷积的链接预测模型
    赵文博, 马紫彤, 杨哲
    2025, 45(1):  15-23.  DOI: 10.11772/j.issn.1001-9081.2023121847
    摘要 ( )   HTML ( )   PDF (2143KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    图神经网络(GNN)为链接预测提供了多样化的解决方案,但由于普通图的结构限制,目前的相关模型在充分利用顶点间的高阶及不对称信息方面存在明显的不足。针对以上问题,提出一种基于有向超图自适应卷积的链接预测模型。首先,使用有向超图结构更充分地表示顶点间的高阶和方向信息,兼具超图和有向图的优势;其次,有向超图自适应卷积采用自适应信息传播方式替代传统有向超图中的定向信息传播方式,从而解决了有向超边尾部顶点不能有效更新嵌入的问题,同时解决多层卷积导致的顶点过度平滑问题。在Citeseer数据集上基于显式顶点特征的实验结果显示,在链接预测任务上,相较于有向超图神经网络(DHNN)模型,所提模型的ROC (Receiver Operating Characteristic)曲线下面积(AUC)指标提升了2.23个百分点,平均精度(AP)提升了1.31个百分点。因此,所提模型可以充分表达顶点间的关系,并有效提高链接预测任务的性能。

    物联网威胁情报知识图谱中潜在关系的挖掘
    程子栋, 李鹏, 朱枫
    2025, 45(1):  24-31.  DOI: 10.11772/j.issn.1001-9081.2024010136
    摘要 ( )   HTML ( )   PDF (2239KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    知识图谱对实现物联网威胁情报(ITI)的共享与利用具有重要意义,图神经网络(GNN)可以应用于ITI知识图谱(ITIKG)的知识表示任务,进而挖掘ITIKG的潜在关系;然而,当前大多数GNN没有考虑节点类型对节点表示能力的影响,且在节点信息聚合过程中使用随机策略进行节点采样,导致这些GNN不能区分不同距离的邻居,且没有考虑节点之间的关联性或重要性。为了解决这些问题,首先,基于不同数据源构建ITIKG;然后,设计确定性采样方法,从而基于节点的重要性采样根节点的邻居,并且考虑邻居距根节点的距离以及邻居在图中的中心性度量,即Katz中心性和中介中心性;最后,设计节点、节点模态和节点类型的嵌入和聚合方法。在此基础上,提出基于确定性采样的多模态异构图神经网络(DM-HGNN)模型。在所构建的ITIKG上的链接预测实验的结果表明,DM-HGNN模型的性能优于metapath2vec、多模态知识图谱表示学习模型(MMKRL)以及复杂图卷积网络(ComplexGCN)等知识表示模型,相较于次优模型MMKRL,DM-HGNN模型在曲线下面积(AUC)上提高了6.8%,在F1值上提高了7.1%,展示了DM-HGNN模型在链接预测任务上有效性和先进性。

    融合路径与子图特征的知识图谱多跳推理模型
    李瑞, 李贯峰, 胡德洲, 高文馨
    2025, 45(1):  32-39.  DOI: 10.11772/j.issn.1001-9081.2024010050
    摘要 ( )   HTML ( )   PDF (1294KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对知识推理模型在捕获实体之间的复杂语义特征方面难以捕捉多层次语义信息,同时未考虑单一路径的可解释性对正确答案的影响权重不同等问题,提出一种融合路径与子图特征的知识图谱(KG)多跳推理模型PS-HAM (Hierarchical Attention Model fusing Path-Subgraph features)。PS-HAM将实体邻域信息与连接路径信息进行融合,并针对不同路径探索多粒度的特征。首先,使用路径级特征提取模块提取每个实体对之间的连接路径,并采用分层注意力机制捕获不同粒度的信息,且将这些信息作为路径级的表示;其次,使用子图特征提取模块通过关系图卷积网络(RGCN)聚合实体的邻域信息;最后,使用路径-子图特征融合模块对路径级与子图级特征向量进行融合,以实现融合推理。在两个公开数据集上进行实验的结果表明,PS-HAM在指标平均倒数秩(MRR)和Hit@kk=1,3,10)上的性能均存在有效提升。对于指标MRR,与MemoryPath模型相比,PS-HAM在FB15k-237和WN18RR数据集上分别提升了1.5和1.2个百分点。同时,对子图跳数进行的参数验证的结果表明,PS-HAM在两个数据集上都在子图跳数在3时推理效果达到最佳。

    层次融合多元知识的命名实体识别框架——HTLR
    吕学强, 王涛, 游新冬, 徐戈
    2025, 45(1):  40-47.  DOI: 10.11772/j.issn.1001-9081.2023111699
    摘要 ( )   HTML ( )   PDF (1466KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR (Chinese NER method based on Hierarchical Transformer fusing Lexicon and Radical),以通过分层次融合的多元知识来帮助模型学习更丰富、全面的上下文信息和语义信息。首先,通过发布的中文词汇表和词汇向量表识别语料中包含的潜在词汇并把它们向量化,同时通过优化后的位置编码建模词汇和相关字符的语义关系,以学习中文的词汇知识;其次,通过汉典网发布的基于汉字字形的编码将语料转换为相应的编码序列以代表字形信息,并提出RFE-CNN (Radical Feature Extraction-Convolutional Neural Network)模型来提取字形知识;最后,提出Hierarchical Transformer模型,其中由低层模块分别学习字符和词汇以及字符和字形的语义关系,并由高层模块进一步融合字符、词汇、字形等多元知识,从而帮助模型学习语义更丰富的字符表征。在Weibo、Resume、MSRA和OntoNotes4.0公开数据集进行了实验,与主流方法NFLAT (Non-Flat-LAttice Transformer for Chinese named entity recognition)的对比结果表明,所提方法的F1值在4个数据集上分别提升了9.43、0.75、1.76和6.45个百分点,达到最优水平。可见,多元语义知识、层次化融合、RFE-CNN结构和Hierarchical Transformer结构对学习丰富的语义知识及提高模型性能是有效的。

    强化学习和矩阵补全引导的多目标试卷生成
    邢长征, 梁浚锋, 金海波, 徐佳玉, 乌海荣
    2025, 45(1):  48-58.  DOI: 10.11772/j.issn.1001-9081.2024010010
    摘要 ( )   HTML ( )   PDF (3169KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的试卷生成技术存在过多关注生成试卷的难易程度,而忽略了其他相关目标,例如质量、分数分布和技能覆盖范围的问题,提出一种强化学习和矩阵补全引导的多目标试卷生成方法,以优化试卷生成领域的特定目标。首先,运用深度知识追踪方法对学生之间的交互信息和响应日志进行建模以获取学生群体的技能熟练程度;其次,运用矩阵分解和矩阵补全方法对学生未做的习题进行得分预测;最后,基于多目标试卷生成策略,为提升Q网络的更新效率,设计一个Exam Q-Network函数逼近器以自动地选择合适的问题集来更新试卷组成。实验结果表明,相较于DEGA (Diseased-Enhanced Genetic Algorithm)、SSA-GA (Sparrow Search Algorithm - Genetic Algorithm)等模型,在试卷难度、合理性、准确性这3个指标上验证了所提模型在解决试卷生成场景的多重困境方面上效果显著。

    基于多路层次化混合专家模型的轴承故障诊断方法
    徐欣然, 张绍兵, 成苗, 张洋, 曾尚
    2025, 45(1):  59-68.  DOI: 10.11772/j.issn.1001-9081.2024010043
    摘要 ( )   HTML ( )   PDF (3277KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对滚动轴承故障诊断中处理复杂工况准确率较低的问题,提出一个多任务学习(MTL)模型,即多路层次化混合专家(MHMoE)模型,以及对应的层次化训练模式。该模型结合多阶段、多任务联合训练,实现了层次化的信息共享模式,并在普通MTL模式的基础上进一步提升了模型的泛化性和故障识别准确率,使模型能同时在复杂与简单的数据集上出色地完成任务,同时,结合一维ResNet的瓶颈层结构,在保证网络深度的同时,也规避梯度爆炸与梯度消失等问题,从而能充分地提取数据集的相关特征。以帕德博恩大学轴承故障数据集(PU)为测试数据集设计的实验的结果表明,在不同工况复杂度下,与不使用MTL的单任务混合专家单元结构(OMoE)-ResNet18模型相比,所提模型的准确率提升5.45~9.30个百分点;而与集成经验模态分解的Hilbert谱变换方法(EEMD-Hilbert)、MMoE (Multi-gate Mixture-of-Experts)和多尺度多任务注意力卷积神经网络(MSTACNN)等模型相比,所提模型的准确率至少提升3.21~16.45个百分点。

    融入实体翻译的汉越神经机器翻译模型
    高盛祥, 侯哲, 余正涛, 赖华
    2025, 45(1):  69-74.  DOI: 10.11772/j.issn.1001-9081.2023121880
    摘要 ( )   HTML ( )   PDF (1039KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源句中实体词的翻译结果;其次,将结果拼接在源句末端作为模型的输入,同时在编码端引入“约束提示信息”增强表征;最后,在解码端融入指针网络机制,以确保模型能复制输出源端句的词汇。实验结果表明,该模型相较于跨语言模型XLM-R (Cross-lingual Language Model-RoBERTa)的双语评估替补(BLEU)值在汉越方向提升了1.37,越汉方向提升了0.21,时间性能上相较于Transformer该模型在汉越方向和越汉方向分别缩短3.19%和3.50%,可有效地提升句子中实体词翻译的综合性能。

    基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法
    李斌, 林民, 斯日古楞null, 高颖杰, 王玉荣, 张树钧
    2025, 45(1):  75-81.  DOI: 10.11772/j.issn.1001-9081.2023121843
    摘要 ( )   HTML ( )   PDF (1437KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG (Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。

    面向长尾分布的民众诉求层次多标签分类模型
    刘昕, 杨大伟, 邵长恒, 王海文, 庞铭江, 李艳茹
    2025, 45(1):  82-89.  DOI: 10.11772/j.issn.1001-9081.2024010085
    摘要 ( )   HTML ( )   PDF (1426KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    接诉即办是实现社会治理智能化、提高人民满意度的重要举措,其中精准分析民众诉求智能匹配工单处理部门,实现诉求的快速响应、高效办理尤为关键;然而,民众诉求数据中的诉求描述不清晰、类别混淆且比例失衡会导致诉求类别分析困难,影响了智能派单的效率与准确性。针对上述问题,提出编解码器结构的诉求层次多标签分类模型(HMCHotline)。首先,在文本编码器中引入诉求领域中的细粒度关键词先验知识以抑制噪声干扰,并融合诉求的时空信息提高语义特征的判别力;其次,利用标签层次结构生成具有层次与语义感知的标签嵌入,并构建基于Transformer模型的标签解码器,利用诉求的语义特征和标签嵌入进行标签解码;同时,在标签的层级依赖关系基础上引入动态标签表策略限制标签的解码范围,以解决标签不一致问题;最后,采用Softmax分组策略将样本数量相近的标签类别分为同组进行Softmax操作,从而缓解由标签长尾分布导致的分类准确率低的问题。在Hotline、RCV1 (Reuters Corpus Volume I)-v2和WOS (Web Of Science)数据集上的实验结果表明,相较于层次感知的标签语义匹配网络(HiMatch),所提模型的Micro-F1分别提高了1.65、2.06和0.43个百分点,验证了模型的有效性。

    基于信号时态逻辑的深度时序事件检测算法
    张思齐, 张金俊, 王天一, 秦小林
    2025, 45(1):  90-97.  DOI: 10.11772/j.issn.1001-9081.2024010131
    摘要 ( )   HTML ( )   PDF (1725KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对深度事件检测模型对复杂时序事件检测准确性不足和忽略了不同事件间相关性的问题,提出一种基于信号时态逻辑的深度时序事件检测算法DSTL (Deep Signal Temporal Logic)。该算法一方面引入信号时态逻辑框架,并用信号时态逻辑(STL)公式建模时间序列中的事件来综合考虑时间序列上事件的逻辑性和时态性;另一方面采用基于神经网络的基础分类器来检测原子事件的发生情况,并通过STL公式结构和语义来辅助检测复杂事件。另外,使用神经网络模块替代相应的逻辑连接词和时态逻辑算子,从而提供可GPU加速和梯度下降的神经网络模块。通过对6个时间序列数据集的实验,验证了该算法在时序事件检测方面的有效性,并把使用DSTL算法的模型与不使用该算法而使用多层感知机(MLP)、长短期记忆(LSTM)网络和Transformer的深度时间序列分类模型进行比较。实验结果表明,使用DSTL算法的模型在5种事件上的平均F1分数提升了约12%,其中3种跨时间点事件上的平均F1分数提升了约14%,且具备更好的可解释性。

    面向多时间步风功率预测的深度时空网络模型
    胡健鹏, 张立臣
    2025, 45(1):  98-105.  DOI: 10.11772/j.issn.1001-9081.2023121750
    摘要 ( )   HTML ( )   PDF (3680KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    准确的风功率预测能为风电能源行业提供可靠的指导和决策依据,然而传统的建模方法主要是将风功率预测问题转换为时序预测问题,忽略了机组间的空间信息,因此,提出一种面向多时间步风功率预测的深度时空网络模型。该模型采用编码器-解码器架构设计,首先,编码器根据历史功率信息建图,并使用图注意力网络(GAT)提取融合风场空间信息的机组特征;其次,使用门控循环单元(GRU)提取输入数据中的时间特性,从而得到关于该机组的风能时间特征;最后,在解码器融合编码器输出的时空特征后,使用样本卷积和交互网络(SCINet)融合不同时间尺度分辨率下的时空特征,输出未来多时间步风功率的预测值。在WindFarm1数据集上的实验结果表明,在预测步数为72时,所提模型的绝对平均误差(MAE)低至42.38,相较于双向门控循环单元(Bi-GRU)的MAE下降了4.25%;所提模型的均方根误差(RMSE)低至42.71,相较于Autoformer的RMSE下降了8.70%。而在WindFarm2数据集上的泛化性实验结果表明,所提模型在不同风场中具备适用性,为未来风功率的准确预测提供了一种新的途径。

    数据科学与技术
    基于多层次图对比学习的序列推荐模型
    余肖生, 王智鑫
    2025, 45(1):  106-114.  DOI: 10.11772/j.issn.1001-9081.2024010126
    摘要 ( )   HTML ( )   PDF (2785KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的基于对比学习的序列推荐模型只考虑了项目和项目或者序列和序列这一个层级的表示学习,而没有办法学习到精细的、易于区分的用户与项目表示的问题,提出一种基于多层次图对比学习的序列推荐(MLGCL-SR)模型。首先,根据用户点击项目的顺序构建项目转移图,并对它进行嵌入表示;其次,利用优化后的双向门控图神经网络(BI-GGNN)在嵌入的项目转移图上进行用户的表示学习;最后,对主要推荐预测任务通过交叉熵损失函数进行参数更新,并使用多层次对比学习任务在嵌入层、节点层、序列层三个层次辅助推荐预测任务进行参数更新,其中在嵌入层和节点层辅助推荐预测任务进行更好的项目表示,而在序列层辅助推荐预测任务进行更好的用户表示。在3个基准数据集Sports、Beauty、Toys上的实验结果表明,相较于对比的最优模型MCLRec (Meta-optimized Contrastive Learning for sequential Recommendation),MLGCL-SR模型在命中率(HR)和归一化折损累计增益(NDCG)指标上有了显著的提升,在能较好反映推荐效果的NDCG@10指标上分别提升了14.2%、19.1%和23.1%,验证了模型的有效性。

    基于加权锚点的自适应多视图互补聚类算法
    区卓越, 邓秀勤, 陈磊
    2025, 45(1):  115-126.  DOI: 10.11772/j.issn.1001-9081.2023121724
    摘要 ( )   HTML ( )   PDF (2525KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在多视图聚类问题中,充分挖掘各视图间的关联信息,并降低冗余信息对聚类效果的影响是当前亟须解决的问题,但现有算法会忽略各视图间的互补性及差异性,或没有考虑冗余信息带来的干扰,从而导致聚类效果不佳。针对这些局限性,提出一种基于加权锚点的自适应多视图互补聚类算法(SMCWA)。在应对高维多视图数据的挑战时,首先,将特征直连迁移至锚点机制,从而融合各锚图来利用视图间的互补性信息;其次,在迭代过程中,使用加权矩阵动态确定各锚点的权重,从而弱化冗余信息的表达;最后,使用自动权重机制为各视图自适应地分配适当的权重,以利用视图间的差异性。将上述优化步骤整合至同一算法中,使视图互补性、冗余信息的弱化以及视图差异性在多步迭代中相互促进、相互学习,进而提高聚类效果。实验结果表明,在BDGP (Berkeley Drosophila Genome Project)数据集上,SMCWA在马修斯相关系数(MCC)上较谱聚类算法SC-Concat提升了41.75%;在CCV (Columbia Consumer Video)数据集上,SMCWA在MCC上较大规模线性时间多视图子空间聚类(LMVSC)算法提升了11.83%;在Caltech101-all数据集上,SMCWA在MCC上较谱聚类算法SC-Best提升了19.57%,说明该算法可充分考虑视图间的互补性信息、视图间的差异和冗余信息来提高聚类效果。

    网络空间安全
    位置大数据的联邦学习统计预测与差分隐私保护方法
    晏燕, 钱星颖, 闫鹏斌, 杨杰
    2025, 45(1):  127-135.  DOI: 10.11772/j.issn.1001-9081.2024010068
    摘要 ( )   HTML ( )   PDF (4957KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对分布式位置大数据收集导致的信息孤岛问题和位置隐私泄露面临的风险,提出一种基于联邦学习的位置大数据统计预测与隐私保护方法。首先,构建基于横向联邦学习的位置大数据统计预测发布框架,该框架允许各行政区域的数据收集者保留各自的原始数据,并使多个参与方通过交换训练参数来协同完成预测模型的训练任务;其次,针对具有时空序列特性的位置大数据密度统计预测问题,设计PVTv2-CBAM,以提高客户端预测结果的准确性;最后,提出一种差分隐私预算的动态分配和调整算法,并结合MMA (Modified Moments Accountant)机制实现对客户端模型的差分隐私保护。实验结果表明,相较于卷积神经网络(CNN)、长短期记忆(LSTM)网络、卷积LSTM(ConvLSTM)模型,PVTv2-CBAM在Yellow_tripdata数据集和T-Driver轨迹数据集上预测的平均绝对误差分别降低0~62%和39%~44%;所提差分隐私预算动态分配和调整算法在调整阈值为0.3和0.7时,使模型预测的准确率与无动态调整相比分别提高了约5%与6%。以上结果验证了所提方法的可行性和有效性。

    基于联邦图神经网络的位置隐私保护推荐方案
    朱亮, 慕京哲, 左洪强, 谷晶中, 朱付保
    2025, 45(1):  136-143.  DOI: 10.11772/j.issn.1001-9081.2024010044
    摘要 ( )   HTML ( )   PDF (2880KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传统的位置服务推荐方案未考虑用户偏好及潜在社交关系等问题,导致推荐结果无法满足用户的个性化需求。图神经网络(GNN)凭借较好的图结构数据处理能力,被广泛用于位置推荐领域;然而,此前研究里中心化的数据范式容易造成位置隐私泄露的问题。因此,提出一种基于联邦图神经网络的位置隐私保护推荐方案(FedGNN-LPR)。首先,通过图注意力网络学习用户的社交关系嵌入和兴趣点(POI)嵌入;其次,建立基于POI的伪标签标注模型预测用户对未知位置的访问次数,以保护用户隐私并缓解冷启动问题;最后,提出基于差分隐私的聚类联邦学习策略保护客户端的交互数据并解决数据异质性问题。在两个公开的真实数据集上进行实验的结果表明,在平均绝对值误差(MAE)和均方根误差(RMSE)方面,所提方案比联邦平均(FedAvg)算法分别降低了7.89%和9.29%,比FL+HC算法分别降低了2.32%和2.75%;并且,所提方案在联邦学习位置推荐上展现出更好的性能。因此,FedGNN-LPR不仅能保护用户位置隐私,而且提高了位置推荐性能。

    基于可编程软件定义网络的动态网络防御方案
    左志斌, 杨凯, 邓淼磊, 王德民, 马米米
    2025, 45(1):  144-152.  DOI: 10.11772/j.issn.1001-9081.2024010090
    摘要 ( )   HTML ( )   PDF (7655KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    嗅探攻击和洪泛攻击是物联网中两种常见的攻击方式:嗅探攻击隐蔽性强,旨在窃取用户数据;而洪泛攻击具有破坏性,会影响正常的网络通信和服务。攻击者可能利用嗅探攻击寻找攻击目标,然后通过洪泛攻击对目标进行攻击,这种攻击方式使IoT面临严重的安全威胁。而端信息跳变、虚假IP跳变、双IP跳变等防御手段侧重于单一类型的攻击,难以有效地应对这种攻击方式。针对IoT环境下面临的安全问题,提出一种基于可编程软件定义网络(SDN)的动态网络防御方案。在攻击侦查阶段,通过动态改变协议号和周期性跳变数据包中的四元组,可成功混淆端信息,从而有效抵御嗅探攻击。在攻击实施阶段,通过首包丢弃和源认证的方式,可成功抵御洪泛攻击,从而显著提高网络的安全性。仿真实验结果表明,与传统针对单一类型攻击的防御方案相比,该方案能在网络攻击的不同阶段有效抵御嗅探攻击和洪泛攻击,并保持了较低的通信时延和CPU负载。

    基于回声状态网络的智能合约漏洞检测方法
    刘春霞, 徐晗颖, 高改梅, 党伟超, 李子路
    2025, 45(1):  153-161.  DOI: 10.11772/j.issn.1001-9081.2024010025
    摘要 ( )   HTML ( )   PDF (1988KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    区块链平台上的智能合约是为链上各方提供安全可信赖服务的去中心化应用程序,而智能合约漏洞检测能确保智能合约的安全性。然而,现有的智能合约漏洞检测方法在样本数量不均衡和语义信息挖掘不全面时,会出现特征学习不足和漏洞检测准确率低的问题,而且,这些方法无法对新的合约漏洞进行检测。针对上述问题,提出一种基于回声状态网络(ESN)的智能合约漏洞检测方法。首先,根据合约图,对不同语义、语法边进行学习,并利用Skip-Gram模型训练得到特征向量;其次,结合ESN和迁移学习,实现对新合约漏洞的迁移扩展,以提高漏洞检测率;最后,在Etherscan平台搜集的智能合约数据集上进行实验。实验结果表明,所提方法的准确率、精确率、召回率和F1分数分别达到了94.30%、97.54%、91.68%和94.52%,与双向长短时记忆(BLSTM)网络、自注意力机制的双向长短时记忆(BLSTM-ATT)相比,所提方法的准确率分别提高了5.93和11.75个百分点,漏洞检测性能更优。消融实验也进一步验证了ESN对智能合约漏洞检测的有效性。

    面向政务协同的访问控制模型
    赵大燕, 何华均, 李宇平, 张钧波, 李天瑞, 郑宇
    2025, 45(1):  162-169.  DOI: 10.11772/j.issn.1001-9081.2024010133
    摘要 ( )   HTML ( )   PDF (1976KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对政务协同场景需求复杂多样、人员流动管理困难、数据隐私度高和数据量大的特点,提出面向政务协同办公的访问控制(GBAC)模型。政务协同场景中的访问控制需要实现多部门对同一资源进行不同操作的需求,而现有的主流访问控制技术面临访问控制粒度不够精细和管理维护成本过高的问题,缺乏安全、灵活、精准的访问控制模型。因此,结合政务部门的运行机制,首先,将政府组织结构和行政区划结构融入访问控制模型,并构建政务人员、组织、资源和行政区划的归属关系树;其次,结合政务工作人员所属组织和岗位等属性,构建联合主体,以实现自动化的权限授予和解除;然后,根据组织职能和行政区划等级设计主客体属性匹配策略,从而打通数据壁垒,并提高鉴权效率;最后,引入权限分级思想,为资源设置数据级别和功能级别,以控制主体的访问阈值,从而提高模型灵活性,并进一步保障数据安全。实验结果表明,与基准模型如基于角色的访问控制(RBAC)和基于属性的访问控制(ABAC)相比,GBAC模型的内存消耗大幅减小,访问时延更低。可见,所提模型能安全、高效、灵活地实现政务协同场景下的权限管理。

    基于信誉的委员会共识机制
    孙敏, 焦世行, 王晨燕
    2025, 45(1):  170-177.  DOI: 10.11772/j.issn.1001-9081.2024010003
    摘要 ( )   HTML ( )   PDF (3066KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    授权股权证明(DPoS)作为主流共识机制的一种,选举过程耗时长、节点投票不积极和恶意节点难处理的核心问题制约着它的快速发展。针对上述问题,提出一种基于信誉的委员会共识机制——幸运信誉证明(PoLaC)。首先,将信誉值作为节点历史行为的评估标准,并选择高信誉节点作为委员会成员,从而极大地简化选举流程;其次,引入幸运值概念来提高普通节点竞选成功的概率,从而激励普通节点参与网络共识;最后,采取延迟分叉的方式修正恶意节点的行为。实验结果表明,在共识通信量方面,投票意愿为50%时,PoLaC网络比DPoS网络的共识通信量少30%;在低权重节点收益方面,PoLaC网络的收益是DPoS的3倍;在委员会恶意节点占比方面,进入信誉稳定期的PoLaC网络的委员会恶意节点数约为DPoS的1/5;而相较于其他同类信誉共识机制,PoLaC在网络通信量、节点活跃度以及恶意节点处理方面均具有一定优势。

    先进计算
    基于S型生长曲线的蝗虫优化算法求解机器人路径规划问题
    冉义, 李永胜, 蒋烨
    2025, 45(1):  178-185.  DOI: 10.11772/j.issn.1001-9081.2024010033
    摘要 ( )   HTML ( )   PDF (1801KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对启发式算法在求解机器人路径规划问题上存在收敛精度低、搜索路径效率低且容易陷入局部最优等问题,提出一种基于S型生长曲线的蝗虫优化算法(SGCIGOA)。首先,引入Logistic混沌序列优化蝗虫初始种群,增强蝗虫种群在迭代初期的多样性;其次,引入S型生长曲线特征的非线性惯性权重,对递减参数递减的方式进行了调整,从而提高算法的收敛速度和寻优精度;最后,在迭代过程中引入基于t分布的位置扰动机制,使算法能充分利用当前种群的有效信息,以更好地平衡全局搜索和局部开发,并降低算法陷入局部最优的概率。实验结果表明,相较于MOGOA (Multi-Objective Grasshopper Optimization Algorithm)、IGOA (Improved Grasshopper Optimization Algorithm)和IAACO (Improvement Adaptive Ant Colony Optimization)等10种对比算法,所提算法在简单环境下的最优路径长度平均缩短0~14.78%,平均迭代次数减少56.60%~90.00%;在复杂环境下的最优路径长度平均缩短0~11.58%,平均迭代次数减少45.00%~92.76%。可见,所提SGCIGOA是用于求解移动机器人路径规划的一种高效算法。

    基于量子动力学的优化算法熵
    唐泉, 王鹏, 辛罡
    2025, 45(1):  186-195.  DOI: 10.11772/j.issn.1001-9081.2023121760
    摘要 ( )   HTML ( )   PDF (1806KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在优化系统分析和研究中,熵是一种常用的描述手段,针对不同优化系统动态行为和熵之间的内在联系缺乏深入分析的问题,提出一种基于量子动力学的优化算法熵。首先基于物理学中的布朗运动与采样行为的相似性提出优化问题的布朗运动描述方法。将优化问题力学表达转化为能量的形式引入薛定谔方程,提出基于量子动力学的优化算法;然后结合优化问题在薛定谔方程下的概率表达得到优化算法熵;最后对目标函数约束下的粒子随机行为进行分析,给出了量子动力学下优化系统的基本搜索行为与熵的关系。实验从参考能量、自由粒子动能和目标函数扰动3个不同方面跟踪和分析优化系统的动态行为和熵的变化趋势,验证了熵与优化系统搜索行为之间的相关性。实验结果表明,基于量子动力学的优化算法熵可以深入分析优化过程,为研究优化算法给出了新的思路和方法。

    计算机软件技术
    基于因果干预的微服务系统故障根因分析方法
    丁建立, 何雨峰, 王静
    2025, 45(1):  196-203.  DOI: 10.11772/j.issn.1001-9081.2024010054
    摘要 ( )   HTML ( )   PDF (2268KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有故障根因分析方法因果关系丢失、在复杂环境中分析效率低下以及缺乏对于非机器指标故障类型分析能力的问题,提出一种基于因果干预的微服务系统故障根因分析(CIMF-RCA)方法。首先,利用马尔可夫假设和调用模式对调用链和微服务进行筛选,从而缩减干预识别的搜索空间并提高故障根因分析方法在复杂环境中的效率;其次,通过解析并融合非结构化的日志数据,实现机器指标数据和日志数据的联合分析;最后,引入因果贝叶斯网络(CBN)和干预数据,提出一种改进的干预识别算法及分治的故障根因分析方式。在大规模微服务基准平台Train-Ticket上进行实验的结果表明,对比表现最优的根本原因发现(RCD)方法,所提CIMF-RCA方法的Top-5平均准确率提高了26.33个百分点,所需时间减少了41.61%;而在RCD无法识别的非机器指标故障类型中,所提方法的Top-5准确率达到了77.00%。可见,所提方法能有效地分析微服务系统中的故障根因。

    多媒体计算与计算机仿真
    用于动态场景高动态范围成像的局部熵引导的双分支网络
    黄颖, 李昌盛, 彭慧, 刘苏
    2025, 45(1):  204-213.  DOI: 10.11772/j.issn.1001-9081.2023121726
    摘要 ( )   HTML ( )   PDF (7127KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对基于多张曝光图像序列的高动态范围(HDR)成像任务在相机抖动或拍摄主体移动时出现运动伪影以及曝光失真的问题,提出一个用于动态场景HDR成像的局部熵引导的双分支网络。首先,利用离散小波变换(DWT)分离出输入图像的低频光照相关信息以及高频运动相关信息,以便于网络有针对性地处理曝光以及主体移动;其次,对于低频光照相关信息分支,设计一个利用图像局部熵计算注意力的模块来引导网络减少细节不足的曝光特征的提取;对于高频运动相关信息分支,引入一个轻量级的特征对齐模块来进行场景的一致性对齐,从而减少运动特征的提取;最后,结合通道注意力构建时域自注意力模块,从而加强曝光图像序列在时间域之间的相互依赖关系,以进一步提高结果质量。在公开数据集Kalantari、Sen、Tursun上进行评估。在Kalantari数据集上的实验结果表明,与最新的一些方法对比,所提网络以PSNR-l为42.20 dB的成绩取得第一,SSIM-l为0.988 9的成绩取得第三。结合其余数据集上的实验结果可知,所提网络可以有效减少曝光失真以及运动伪影,并生成细节多、视觉效果佳的图像。

    基于坐标几何采样的点云配准方法
    梁杰涛, 罗兵, 付兰慧, 常青玲, 李楠楠, 易宁波, 冯其, 何鑫, 邓辅秦
    2025, 45(1):  214-222.  DOI: 10.11772/j.issn.1001-9081.2024010045
    摘要 ( )   HTML ( )   PDF (1746KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了提高点云配准的精度、鲁棒性和泛化性,解决迭代最近点(ICP)算法容易陷入局部最优解的问题,提出一种基于坐标几何采样的深度最近点(GSDCP)的点云配准方法。首先,基于每个点的周围点的坐标估计中心点曲率,并通过曲率大小筛选出能保留点云几何特征的点,从而完成点云下采样;然后,使用动态图卷积神经网络(DGCNN)配合下采样点云学习融入局部几何信息的点云特征,并通过Transformer捕获两个特征嵌入之间的上下文信息、使用软指针近似组合匹配;最后,利用一个可微的奇异值分解(SVD)层估计最终的刚性变换。在数据集ModelNet40上进行的点云配准实验结果表明,与ICP、Go-ICP (Globally optimal ICP)、PointNetLK、快速全局配准(FGR)、ADGCNNLK (Attention Dynamic Graph Convolutional Neural Network Lucas-Kanade)、深度最近点(DCP)和多特征引导网络(MFGNet)相比,在无噪声、有噪声和看不见点云类别的情况下GSDCP的配准精度和鲁棒性都最好;其中在无噪声的情况下,与MFGNet相比,GSDCP的旋转均方误差(MSE)降低了31.3%,平移MSE降低了58.3%;在有噪声的情况下, GSDCP的旋转MSE降低了33.9%,平移MSE降低了73.4%;在看不见点云类别的情况下, GSDCP的旋转MSE降低了57.7%,平移MSE降低了77.9%。除此之外,对不完整点云数据(包括随机遮挡和点云残缺),在点云完整度为75%以下时, GSDCP的旋转MSE降低了35.1%,平移MSE降低了39.8%。

    基于解耦注意力与幻影卷积的轻量级人体姿态估计
    陈俊颖, 郭士杰, 陈玲玲
    2025, 45(1):  223-233.  DOI: 10.11772/j.issn.1001-9081.2024010099
    摘要 ( )   HTML ( )   PDF (3442KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着轻量级网络的发展,人体姿态估计任务得以在计算资源有限的设备上执行,然而,提升精度变得更具有挑战性。这些挑战主要源于网络复杂度与计算资源的矛盾,导致模型在简化时牺牲了表示能力。针对上述问题,提出一种基于解耦注意力和幻影卷积的轻量级人体姿态估计网络(DGLNet)。具体来说,DGLNet以小型高分辨率网络(Small HRNet)模型为基础架构,通过引入解耦注意力机制构建DFDbottleneck模块;采用shuffleblock的结构对基础模块进行重新设计,即用轻量级幻影卷积替代计算量大的点卷积,并利用解耦注意力机制增强模块性能,从而构建DGBblock模块;此外,用幻影卷积和解耦注意力重新构建的深度可分离卷积模块来替代原过渡层模块,从而构建GSCtransition模块,进一步减少计算量并增强特征交互性和提高性能。在COCO验证集上的实验结果显示,DGLNet优于轻量级高分辨率网络(Lite-HRNet),在计算量和参数量不增加的情况下,最高精度达到了71.9%;与常见的轻量级姿态估计网络MobileNetV2和ShuffleNetV2相比,DGLNet在仅使用21.2%和25.0%的计算量情况下分别实现了4.6和8.3个百分点的精度提升;在AP50的评价标准上,DGLNet超过了大型高分辨率网络(HRNet)的同时计算量和参数量远小于HRNet。

    基于注意力机制和能量函数的动作识别算法
    王丽芳, 吴荆双, 尹鹏亮, 胡立华
    2025, 45(1):  234-239.  DOI: 10.11772/j.issn.1001-9081.2024010004
    摘要 ( )   HTML ( )   PDF (1695KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对零样本动作识别(ZSAR)算法的框架缺乏结构性指导的问题,以基于能量的模型(EBM)指导框架设计,提出基于注意力机制和能量函数的动作识别算法(ARAAE)。首先,为了得到EBM的输入,设计了光流加3D卷积(C3D)架构的组合以提取视觉特征,从而达到空间去冗余的效果;其次,将视觉Transformer (ViT)用于视觉特征的提取以减少时间冗余,同时利用ViT配合光流加C3D架构的组合以减少空间冗余,从而获得非冗余视觉空间;最后,为度量视觉空间和语义空间的相关性,实现能量评分评估机制,设计联合损失函数来进行优化实验。采用6个经典ZSAR算法及近年文献里的算法在两个数据集HMDB51和UCF101进行实验的结果表明:相较于CAGE (Coupling Adversarial Graph Embedding)、Bi-dir GAN (Bi-directional Generative Adversarial Network)和ETSAN (Energy-based Temporal Summarized Attentive Network)等算法,在平均分组的HMDB51数据集上,ARAAE平均识别准确率提升至(22.1±1.8)%,均明显优于对比算法;在平均分组的UCF101数据集上,ARAAE的平均识别准确率提升至(22.4±1.6)%,略优于对比算法;在以81/20为分割方式的UCF101数据集上,ARAAE的平均识别准确率提升至(40.2±2.6)%,均大于对比算法。可见,ARAAE在ZSAR中能有效提高识别性能。

    利用局部-全局时间依赖的弱监督视频异常检测
    宋鹏程, 郭立君, 张荣
    2025, 45(1):  240-246.  DOI: 10.11772/j.issn.1001-9081.2024010104
    摘要 ( )   HTML ( )   PDF (2773KB) ( )   PDF(mobile) (1260KB) ( 5 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    弱监督视频异常检测(WS-VAD)对智能安防领域具有重要意义。而目前WS-VAD任务面临以下问题:现有方法更关注对视频片段本身的判别,而忽略了片段之间的局部和全局时间依赖性;在损失函数设置上忽略了异常事件的时序结构;异常视频中存在大量正常片段噪声,干扰训练的收敛。因此,提出一种基于局部-全局时间依赖(LGTD)网络的弱监督视频异常检测方法。该方法中,LGTD网络利用多尺度时序特征融合(MTFF)模块捕获不同时间跨度内片段的局部时间相关性;同时,利用多头自注意力(MHSA)模块整合视频内所有片段的信息,从而理解整个视频序列的时间相关性;之后,利用通道注意力挤压-激励(SE)模块优化片段内部的特征权重,从而更准确地捕捉视频片段的时空特征,并显著提升检测性能。此外,进一步改进现有损失函数,即引入互补的K-maxmin包内损失和Top-K包外损失,以提高从异常视频中选取异常片段进行训练优化的概率。实验结果表明,所提方法在UCF-Crime和ShanghaiTech数据集上的平均曲线下面积(AUC)分别达到了83.18%和95.41%,;与协同正态学习(CNL)方法相比,分别提高了0.08和7.21个百分点。可见,所提方法能有效提升检测性能。

    无迭代图胶囊网络的遥感场景分类
    杨顺, 边小勇, 陈希
    2025, 45(1):  247-252.  DOI: 10.11772/j.issn.1001-9081.2024010111
    摘要 ( )   HTML ( )   PDF (1760KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前大多数胶囊网络方法通过改进迭代路由的方式提高分类精度,而忽略了迭代路由本身复杂的计算量带来的负担。虽然有方法采用无迭代的路由训练胶囊网络,但是精度不佳。针对以上问题,提出无迭代路由图胶囊网络的场景分类模型。首先,利用简单卷积层提取输入图像的初始特征;接着,提出通道和胶囊间双融合的全局注意力模块,通过依次进行通道和胶囊之间的注意力生成全局权重系数来加权高级胶囊特征,使加权后的高级胶囊特征更具判别性,以突出重要的胶囊,从而提高分类性能;同时,引入能计算图像间相似性的等变正则化项,以建模胶囊网络的显式等变性,从而潜在地提升网络性能;最后,基于边界损失和等变损失的组合损失函数训练整个网络,以得到富于判别性的分类模型。在多个基准场景数据集上的实验结果验证了所提方法的有效性和效率。实验结果表明,所提方法在加拿大高级研究所的10类图像数据集(CIFAR-10)上的分类准确率达到90.38%,与动态路由胶囊网络(DR-Caps)方法相比,提高了15.74个百分点;并且在仿射手写数字图像(AffNIST)数据集和航空影像数据集(AID)上,分别取得了98.21%和86.96%的分类准确率。可见,所提方法有效提高了场景分类性能。

    基于上下文通道注意力机制的人脸属性估计与表情识别
    徐杰, 钟勇, 王阳, 张昌福, 杨观赐
    2025, 45(1):  253-260.  DOI: 10.11772/j.issn.1001-9081.2024010098
    摘要 ( )   HTML ( )   PDF (2220KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA (CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace (Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER (Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。

    可变形卷积网络的解释性研究及其在蝴蝶物种识别模型中的应用
    王璐, 刘东, 刘卫光
    2025, 45(1):  261-274.  DOI: 10.11772/j.issn.1001-9081.2023121776
    摘要 ( )   HTML ( )   PDF (8020KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNet50和DenseNet121 (Dense Convolutional Network121)分类模型进行改进;其次,采用反卷积和类激活映射(CAM)等可视化手段来对比可变形卷积和标准卷积在特征提取能力上的差异,且通过消融实验结果表明可变形卷积在神经网络的较低层且不连续使用时效果更佳;再次,提出显著性移除(SR)并对CAM的性能和激活特征重要性进行统一评价,同时通过设置不同的移除阈值等多个角度,提高评价的客观性;最后,基于评价结果更高的FullGrad (Full Gradient-weighted)解释模型识别的判断依据。实验结果显示,在Archive_80数据集上,所提出的D_v2-DenseNet121的准确率达到97.03%,相较于DenseNet121分类模型提高了2.82个百分点。可见,可变形卷积的引入赋予了神经网络模型不变性特征提取能力,并提高了分类模型的准确率。

    用于红外-可见光图像分类的跨模态双流交替交互网络
    郑宗生, 杜嘉, 成雨荷, 赵泽骋, 张月维, 王绪龙
    2025, 45(1):  275-283.  DOI: 10.11772/j.issn.1001-9081.2024010026
    摘要 ( )   HTML ( )   PDF (2286KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    多特征模态融合时存在噪声的叠加,而为减小模态间的差异采用的级联方式的结构也未充分利用模态间的特征信息,因此设计一种跨模态双流交替交互网络(DAINet)方法。首先,构建双流交替增强(DAE)模块,以交互双分支形式融合模态特征,并通过学习模态数据的映射关系,以红外-可见光-红外(IR-VIS-IR)和可见光-红外-可见光(VIS-IR-VIS)的双向反馈调节实现模态间噪声的交叉抑制;然后,构建跨模态特征交互(CMFI)模块,并引入残差结构将红外-可见光模态内以及模态间的低层特征和高层特征进行有效融合,从而减小模态间的差异并充分利用模态间的特征信息;最后,在自建红外-可见光多模态台风数据集及RGB-NIR多模态公开场景数据集上进行实验,以验证DAE模块和CMFI模块的有效性。实验结果表明,与简单级联融合方法相比,所提的基于DAINet的特征融合方法在自建台风数据集上的红外模态和可见光模态上的总体分类精度分别提高了6.61和3.93个百分点,G-mean值分别提高了6.24和2.48个百分点,表明所提方法在类别不均衡分类任务上的通用性;所提方法在RGB-NIR数据集上的2种测试模态下的总体分类精度分别提高了13.47和13.90个百分点。同时,所提方法在2个数据集上分别与IFCNN(general Image Fusion framework based on Convolutional Neural Network)和DenseFuse方法进行对比的实验结果表明,所提方法在自建台风数据集上的2种测试模态下的总体分类精度分别提高了9.82、6.02和17.38、1.68个百分点。

    基于信息补偿的红外弱小目标检测方法
    杨博然, 蔺素珍, 李大威, 禄晓飞, 崔晨辉
    2025, 45(1):  284-291.  DOI: 10.11772/j.issn.1001-9081.2024010102
    摘要 ( )   HTML ( )   PDF (2901KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对红外弱小目标容易在网络迭代过程中损失纹理细节信息,从而导致目标定位和轮廓分割的准确性下降的问题,提出一种基于信息补偿的红外弱小目标检测方法。首先,利用图像特征提取(IFE)模块编码红外源图像的浅层细节及深层语义特征;其次,构建多级信息补偿(MIC)模块通过聚合相邻级别的特征对编码阶段下采样后的特征进行信息补偿;随后,引入全局目标响应(GTR)模块联合特征图的全局上下文信息对卷积局部性的限制进行补偿;最后,构建非对称交叉融合(ACF)模块对浅层和深层特征进行融合,以实现目标解码时纹理信息与位置信息的保留,进而完成对红外弱小目标的检测。在公开的NUAA-SIRST (Nanjing University of Aeronautics and Astronautics-Single-frame InfraRed Small Target)和NUDT-SIRST (National University of Defense Technology-Single-frame InfraRed Small Target)混合数据集上训练和测试的实验结果表明,与UIUNet (U-Net in U-Net Network)、LSPM (Local Similarity Pyramid Modules)和DNANet (Dense Nested Attention Network)等方法相比,所提方法在交并比(IoU)上分别提高了9.2、8.9和5.5个百分点,在F1分数(F1-Score)上分别提高了6.0、5.4和3.1个百分点。以上表明所提方法对红外复杂背景图像中的弱小目标可以实现准确检测和有效分割。

    融合注意力和上下文信息的遥感图像小目标检测算法
    刘赏, 周煜炜, 代娆, 董林芳, 刘猛
    2025, 45(1):  292-300.  DOI: 10.11772/j.issn.1001-9081.2024010125
    摘要 ( )   HTML ( )   PDF (3552KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    对多尺度的遥感图像进行小目标检测时,基于深度学习的目标检测算法容易出现误检和漏检的情况。这是因为此类算法的特征提取模块进行了多次的下采样操作;而且未能根据不同类别、不同尺度的目标关注所需的上下文信息。为了解决该问题,提出一种融合注意力和上下文信息的遥感图像小目标检测算法ACM-YOLO(Attention-Context-Multiscale YOLO)。首先,应用细粒度的查询感知稀疏注意力以减少小目标特征信息的丢失,从而避免漏检;其次,设计局部上下文增强(LCE)函数以更好地关注不同类别的遥感目标所需的上下文信息,从而避免误检;最后,使用加权双向特征金字塔网络(BiFPN)强化特征融合模块对遥感图像小目标的多尺度特征融合能力,从而改善算法检测效果。在DOTA数据集和NWPU VHR-10数据集上进行对比实验和消融实验,以验证所提算法的有效性和泛化性。实验结果表明,在2个数据集上所提算法的平均精确率均值(mAP) 分别达到了77.33%和96.12%,而相较于YOLOv5算法,召回率分别提升了10.00和7.50个百分点。可见,所提算法能有效提升mAP和召回率,减少误检和漏检。

    基于多维空间卷积信息增强的低质车牌信息超分辨率重建
    张睿, 惠永科, 张延军, 潘理虎
    2025, 45(1):  301-307.  DOI: 10.11772/j.issn.1001-9081.2024010121
    摘要 ( )   HTML ( )   PDF (3874KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有交通监控终端采集到的车辆影像通常存在远景低分辨率现象,并伴随有强噪、模糊、过曝、欠曝等一些不确定性像素影响因素,导致车牌信息智能识别的精度难以保证。针对上述问题,提出基于多维空间卷积信息增强的低质车牌信息超分辨率重建(LL-SR)网络。首先,利用卷积挖掘空间与通道特征点的相关性,聚合浅层特征;其次,从不同感受野和不同维度挖掘特征图之间的关联关系,从而恢复车牌信息的高频细节;最后,对得到的不同尺度特征进行跨通道像素级融合和矫正,以减少无用特征在上下文的传播,实现低质车牌信息的超分辨率重建。在太原车牌(LT)和美国车牌(LU)数据集上的实验结果表明,所提网络的峰值信噪比(PSNR)和结构相似性(SSIM)分别为26.682 4 dB和0.820 3及22.356 7 dB和0.781 3,相较于NGramSwin(N-Gram in Swin transformers)和CARN(CAscading Residual Network)分别提升了0.210 9 dB和1.736 1 dB、0.005 7和0.033 0及0.472 8 dB和1.419 2 dB、0.019 6和0.039 9;且重建后的车牌信息具有更好的视觉效果。

    利用全局-局部特征依赖的反欺骗说话人验证系统
    张嘉琳, 任庆桦, 毛启容
    2025, 45(1):  308-317.  DOI: 10.11772/j.issn.1001-9081.2023121877
    摘要 ( )   HTML ( )   PDF (2942KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有卷积模型为主的反欺骗说话人验证系统捕获全局特征依赖不理想的问题,提出一种利用全局-局部特征依赖的反欺骗说话人验证系统。首先,对于欺骗语音检测模块,设计两种滤波器组合方式对原始语音进行滤波,并通过对频率子带的掩蔽实现样本扩充;其次,提出多维全局注意力机制,通过对信道维度、频率维度和时间维度分别进行池化,获得每个维度的全局依赖关系,并将全局信息通过加权的方式与原始特征相融合;最后,在说话人验证部分引入统计金字塔池化时延神经网络(SPD-TDNN),在获取多尺度时频特征的同时计算特征的标准差,并加入全局信息。实验结果表明,与集成时频图卷积(AASIST)模型相比,在ASVspoof2019数据集上提出的欺骗语音检测系统将等错误率(EER)降低了65.4%;与单独的金字塔池化说话人验证系统相比,提出的反欺骗说话人验证系统将欺骗感知说话人验证等错误率降低了约97.8%。以上验证了所提两个模块借助全局特征依赖能实现更好的分类效果。

    结合字节级别字节对编码的端到端中文语音识别方法
    付强, 徐振平, 盛文星, 叶青
    2025, 45(1):  318-324.  DOI: 10.11772/j.issn.1001-9081.2023121878
    摘要 ( )   HTML ( )   PDF (1657KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对语音识别中对中文这种复杂字符集的语言词汇表过大以及训练效率太低的问题,提出一种基于字节级别字节对编码(BBPE)的端到端中文语音识别方法。首先,将256个不同的字节用于初始化词汇表;其次,统计每个词汇单元在语料中出现的频率,并合并频率最高的词汇单元;最后,重复上一步直至无法合并,以得到最终的词汇表。在中文语音数据集AISHELL-1上,该方法生成的词汇表相较于字符级别词汇表的词汇量减少了88.5%,降低了模型训练的复杂度。同时,鉴于Conformer-Transducer (Conformer-T)模型在端到端语音识别中的出色表现,为了实现更好的识别效果,将最新的Zipformer模型与Transducer模型相结合提出Zipformer-Transducer (Zipformer-T)模型,并在该模型上对BBPE方法进行验证。实验结果表明,Zipformer-T模型使用的BBPE方法相较于字符级别分词方法在AISHELL-1测试集和验证集上的字错率(CER)分别降低了0.12和0.08个百分点,且分别达到4.26%和3.98%的最低CER,充分说明该方法能有效提升中文语音识别的性能。

    前沿与综合应用
    地下封闭水体内多无人艇协同的视觉定位方法
    车文博, 王建华, 郑翔, 吴恭兴, 张舜, 王浩铸
    2025, 45(1):  325-336.  DOI: 10.11772/j.issn.1001-9081.2023121827
    摘要 ( )   HTML ( )   PDF (6112KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对无人艇(USV)在地下封闭水体中卫星定位信号缺失、通信受限、环境光线弱等问题,提出一种地下封闭水体内多USV协同的视觉定位方法。首先,设计一种艇载光源合作标志物,并根据艇身结构与应用场景对标志物结构进行优化;其次,采用单目视觉采集标志物图像,并求取特征点的图像坐标;再次,根据摄像机成像模型,基于合作标志物特征点的空间坐标及其对应的图像坐标之间的关系,通过改进直接线性变换方法求解相邻艇间的相对位置;然后,利用前后艇的摄像机进行艇间对视,并通过最小方差算法,融合根据前后艇摄像机图像求解所得的相对位置,以提高相对定位精度;最后,利用场景中已知的绝对坐标,获得各无人艇的绝对位置。仿真实验对影响定位误差的因素进行分析,并把所提方法与传统直接线性变换方法进行对比。结果表明,随着距离的增加,所提方法求解优势更趋明显,在距离15 m时求解的位置方差稳定在0.2 m2以内,验证了所提方法的准确性。静态实验结果表明,所提方法能将相对误差稳定在10.0%以内;地下河道内的动态实验结果表明,所提方法求解的绝对定位的航行轨迹达到与卫星定位相当的精度,验证了所提方法的可行性。

    基于全局状态预测与公平经验重放的交通信号控制算法
    缪孜珺, 罗飞, 丁炜超, 董文波
    2025, 45(1):  337-344.  DOI: 10.11772/j.issn.1001-9081.2024010066
    摘要 ( )   HTML ( )   PDF (3199KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了应对交通拥堵而设计的高效交通信号控制算法能提升现有交通网络下的车辆通行效率。尽管深度强化学习算法在单路口交通信号控制问题上已展现出卓越的性能,然而这些算法在多路口环境下的应用仍然面临着重大的挑战——多智能体强化学习(MARL)算法产生的时间和空间的部分可观测性引发的非平稳性问题会导致这些算法无法稳定的收敛。因此,提出一种基于全局状态预测与公平经验重放的多路口交通信号控制算法IS-DQN。一方面,基于不同车道的车流历史信息预测多路口的全局状态,从而扩展IS-DQN的状态空间,以避免算法产生空间部分可观测性而带来非平稳性问题;另一方面,为应对传统经验重放策略的时间部分可观测性,采用蓄水池抽样算法来保证经验重放池的公正性,进而避免其中的非平稳性问题。在复杂的多路口环境下应用IS-DQN算法进行3种不同的交通压力仿真实验的结果表明:在不同交通流情况下,尤其是在中低交通流量下,相较于独立的深度强化学习算法,IS-DQN算法能得到更短的车辆平均行驶时间,并表现出了更优的收敛性能与收敛稳定性。

2025年 45卷 4期
刊出日期: 2025-04-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会