《计算机应用》唯一官方网站

ContraStacker：一种极度不平衡欺诈检测的集成方法

李星灿, 丁立中, 张君宇, 张春晖

2026, 46(5): 1363-1369. DOI: 10.11772/j.issn.1001-9081.2025050692

摘要 ( )

HTML ( )

PDF (776KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

机器学习依托数据建模与特征识别技术构建社会风险预测模型，赋能防控体系智能决策。然而，欺诈检测任务因正负样本数量严重不平衡导致传统方法效果受限，在极端不平衡的情况下，即便模型将所有交易预测为正常交易，准确率仍可高达99%以上，但欺诈交易的检出率却接近零；且单一模型仅能捕捉特定维度的欺诈特征，难以全面预测多种欺诈模式。因此，提出ContraStacker集成方法，突破数据不平衡限制，弥补单一模型的局限，精准识别多种欺诈模式，提升欺诈交易检出率。ContraStacker通过过采样、欠采样及其组合策略平衡数据分布，构建多风险预警器，并在Stacking框架中引入对比损失函数，深度融合模型预测结果与原始特征，增强模型泛化能力，成功应对极端不平衡的欺诈检测挑战。实验结果表明，ContraStacker在多个欺诈检测数据集上有效降低了误报率（FPR）（将正常交易预测为欺诈交易的比例），同时保持较低的漏检率（FNR）（将欺诈交易预测为正常交易的比例），在金融交易安全中具备应用潜力。

图扩散与双视图特征学习增强的图卷积网络

郑宝源, 贺超波

2026, 46(5): 1370-1377. DOI: 10.11772/j.issn.1001-9081.2025050610

摘要 ( )

HTML ( )

PDF (876KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

图卷积网络（GCN）在图表示学习领域已展现了强大的潜力，然而，现有的GCN方法在全局拓扑关系学习以及拓扑结构和属性特征融合方面仍存在局限性。针对该问题，提出一种图扩散与双视图特征学习增强的图卷积网络（GCN-GDDV）。该网络首先引入广义图扩散机制构建包含全局拓扑结构信息的扩散图；随后，结合属性特征K近邻图进行基于GCN的双视图特征学习，以分别捕捉全局结构关系依赖与节点属性的语义相似性；最后，设计注意力网络实现拓扑结构和属性特征的自适应融合。在3个常用图数据集上进行节点分类实验的结果表明：GCN-GDDV相较于次优方法在准确率、Macro-F1和Micro-F1指标上分别提升1.78%、1.60%和0.30%。

拓扑语义双域协同的图神经网络框架

富坤, 魏昊宇, 刘伟静, 党兴, 刘泽政, 李建伟

2026, 46(5): 1378-1387. DOI: 10.11772/j.issn.1001-9081.2025050566

摘要 ( )

HTML ( )

PDF (1339KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

图神经网络（GNN）在处理标记节点稀疏且分布不均的图数据时，普遍面临欠可达问题（Under-Reach），即远端未标记节点因拓扑限制难以接收有效监督信号，导致模型泛化能力受限。现有方法虽能部分解决这一问题，但仍存在过度平滑、计算复杂度高、噪声敏感等局限性。因此，提出一种拓扑语义双域协同的图神经网络框架TriMix，通过三方面改进应对上述挑战：1）动态混合比例机制。基于训练轮次自适应调整伪标签与真实标签的混合权重，在训练初期依赖真实标签稳定收敛，后期逐步引入高置信伪标签以扩展决策边界。2）拓扑语义双域协同的节点加权采样策略。融合节点度、PageRank值和特征相似性，量化节点重要性并优化信息传播路径，提升低中心性节点的可达性。3）对比学习模块。通过类别驱动、特征相似性加权与伪标签引导的三级负样本生成策略，优化嵌入空间的正负样本区分度，增强模型对未标记数据的语义理解。在Cora、PubMed等经典数据集上的实验结果表明，TriMix的节点分类准确率比图卷积网络（GCN）、图注意力网络（GAT）等基线模型高2.1%~4.4%，F1评分与泛化能力均有所提升。TriMix框架通过拓扑结构与语义特征的双域协同优化显著提升了稀疏标记图数据的学习效率，为复杂图结构中的节点分类任务提供了新思路。

基于概念漂移检测的多重主动学习方法

祁晓博, 张晶, 史颖, 亓慧, 杜航原

2026, 46(5): 1388-1396. DOI: 10.11772/j.issn.1001-9081.2025050659

摘要 ( )

HTML ( )

PDF (1231KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

数据流的实时性、无限性及动态变化特性导致数据分布具有时变性，这种随时间持续变化的现象被称为概念漂移。为检测并适应概念漂移，传统方法通常假设所有样本标签已知，但真实场景下高昂的数据标记成本使得监督学习方法代价过大，因此，主动学习方法常用于解决标签稀缺的分类任务。然而在流式环境下，概念漂移及单一标注策略等因素通常会使主动学习方法面临采样偏差。针对以上问题，提出一种基于概念漂移检测的多重主动学习方法（MALCD）。该方法设计了一种带有动态权重跳连接的在线深度神经网络模型，利用该网络模型结合弱监督漂移检测方法检测概念漂移，并融入多重采样策略，在不同样本域采用差异化策略处理。这种将多重主动学习与概念漂移检测技术相结合的方法能精准筛选不确定性高且数据类别多样的数据，高效规避冗余。在8个真实及人工数据集上的实验结果表明，MALCD的累积准确率相较于在线集成自适应分类（AC_OE）方法及弱监督概念漂移检测（WSCDD）等方法整体排名最靠前，说明该方法在漂移发生后能快速学习新概念分布，提高模型的整体泛化性能。

边缘异构下的高效联邦分割学习框架HEFSL

俞浩, 范菁, 郗恩康, 金亚东, 董华, 孙伊航

2026, 46(5): 1397-1407. DOI: 10.11772/j.issn.1001-9081.2025050601

摘要 ( )

HTML ( )

PDF (987KB) ( )

数据和表 | 参考文献 | 补充材料 | 相关文章 | 计量指标

边缘异构环境下的联邦学习（FL）面临终端算力差异大、数据分布不一致及通信开销高等挑战，严重制约了它在实际智能系统中的部署与应用。因此，提出一种高效联邦分割学习（HEFSL）框架，融合FL与分割学习（SL）的优势，通过“模型切分-客户端选择-双层聚合”的三重机制，实现系统异构性与统计异构性的协同优化。HEFSL框架中，首先引入自适应分割策略（ASS），依据客户端计算能力动态确定模型切分结构，缓解“落后者”效应；其次设计基于多样性的启发式客户端选择（CDHS）机制，基于标签熵驱动的低复杂度策略提升数据代表性；最后构建异步双端聚合（ADA）方案，在客户端与边缘服务器间实现分层异步更新，突破同步通信瓶颈，加快模型收敛。理论部分对HEFSL框架的收敛性与误差上界进行了严格分析与证明。在3个具有标签异构特征的数据集FMNIST、CIFAR-10与CIFAR-100上的实验结果表明，HEFSL的模型精度表现最优，相较于FedAvg、FedProx（Federated Proximal）、MOON（MOdel-cONtrastive learning）、联邦分割学习（SplitFed）、SplitMix（Split Mixing）与FedCRS（Federated Cluster-based Round Splitting）分别至少提高了4.3、10.5与4.1个百分点；同时，在收敛速度上分别至少提升78.6%、89.8%与64.5%。HEFSL在面向边缘异构场景的分布式协同智能中优势明显，可为资源受限环境下高效、可扩展的联邦学习提供一种可行路径，具备良好的工程适应性与应用前景。

基于自适应注意力与嵌套感受野改进DeepLabV3+方法

邢长征, 郑鑫, 贾迪, 梁浚锋

2026, 46(5): 1408-1415. DOI: 10.11772/j.issn.1001-9081.2025050595

摘要 ( )

HTML ( )

PDF (1402KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对DeepLabV3+模型因使用不同膨胀率空洞卷积导致复杂度高及部分类别分割精度低的问题，提出一种融合进化式嵌套感受野（ENRF）模块与自适应类别通道注意力（ACCA）机制的改进方法。该方法将原有空洞空间卷积池化金字塔（ASPP）模块替换为ENRF模块，并在融合特征中引入ACCA机制，实现了感受野的连续拓展与更精细化的特征表达，同时降低了参数量和计算开销，提升了模型的轻量化水平。首先，ACCA机制通过融合通道自适应注意力与类别自适应2种注意力机制，挖掘通道间和类别间的特征依赖关系，提升特征图中关键信息的表达能力；其次，ENRF模块引入不同大小和不同膨胀率的卷积核，构建了一种基于嵌套感受野演化的网络结构，以扩大特征图的感受野，捕捉多尺度的上下文信息及细粒度的边缘特征。与全卷积网络（FCN8s）、金字塔场景解析网络（PSPNet）、统一感知解析网络（UPerNet）、双向分割网络（BiSeNet V2）、深度特征聚合网络（DFANet）以及原始DeepLabV3+在浮点运算次数（FLOPs）、参数量、均值交并比（mIoU）、推理速度和内存占用5个指标上进行对比实验的结果表明，改进后的DeepLabV3+方法在减少参数量和FLOPs的同时，也提高了推理速度并改善了图像分割性能。

基于不确定性感知非似然学习的监督对比生成式情感分析方法

张棣锐, 林佳瑜, 梁祖红

2026, 46(5): 1416-1423. DOI: 10.11772/j.issn.1001-9081.2025050581

摘要 ( )

HTML ( )

PDF (697KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有模型在方面情感四元组预测（ASQP）任务中仍面临着多重挑战：它们在处理隐式情感表达（如隐含的方面或观点）时存在困难，隐式情感表达缺乏明确的词汇线索，导致模型难以准确捕捉情感倾向；只有当四元组预测的所有预测元素都与正确元素完全匹配时，模型才被认为是准确的，而模型会生成易混淆近义词或同义词，导致四元组预测完全错误。而且现有模型致力于提高预测正确词语的概率，忽略了抑制易混淆词的概率；同时，现有模型采用的交叉熵损失使模型对错误预测过于自信，缺乏对不确定性的建模，难以主动抑制高风险错误。这些问题限制了现有模型在基于方面的情感分析（ABSA）任务上的表现。为了解决这些问题，提出一种基于不确定性感知非似然学习的监督对比生成式情感分析方法（SCUAUL）。首先，采用监督对比学习，通过对比损失拉近同类样本（如相同情感极性）的语义空间距离，增强模型对输入数据的关键特征（如情感极性、隐式方面等）的区分能力；其次，利用蒙特卡洛Dropout（MC Dropout）捕捉模型内在不确定性，发现易混淆词，通过边缘化非似然学习动态抑制易混淆词汇的生成概率，保持正确词汇的生成概率，并结合最小熵约束平衡生成多样性与准确性。在Rest15和Rest16数据集上进行5次实验的平均结果显示，相较于次优模型AugABSA（data Augmentation by text generation for ABSA）和经典模型PARAPHRASE，SCUAUL的精确率分别提升了0.40、3.98和0.38、3.83个百分点，召回率分别提升了0.30、2.87和0.48、2.88个百分点，F1 score分别提升了0.35、3.43和0.42、3.37个百分点，验证了SCUAUL在ABSA任务上的有效性。

基于因果偏序图的情态动词语义消歧方法

付继林, 于建平, 张涛, 徐伟华, 闫恩亮, 王丽洋

2026, 46(5): 1424-1432. DOI: 10.11772/j.issn.1001-9081.2025050624

摘要 ( )

HTML ( )

PDF (751KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

情态动词的语义解析因内在的复杂性而面临诸多挑战，它要求在语义消歧（WSD）过程中提取多样化的特征集，包括语义特征、句法特征、语用特征以及体裁特征。这些特征对于语义消歧的贡献程度各异，还有一些特征为混淆和冗余特征。为了消除混淆和冗余特征对语义消歧的影响，提出一种基于因果偏序图（CPOD）的语义消歧方法。借鉴因果推理中的干预（intervention）概念，利用do-calculus消除混淆因素，再结合属性偏序图（APOD）的构建思路构建CPOD作为情态动词的语义消歧模型。对15个情态动词的语义消歧实验结果表明，所提方法的平均正确率达到了93.42%，消除了混淆和冗余特征。进一步地，为了量化有效特征对语义消歧的具体贡献，计算并排序了每个特征对语义消歧的贡献度，发现语义特征的贡献最显著，其次是句法特征，而体裁特征的贡献相对较小；特别地，在语义特征中，低值互信息特征对语义消歧的贡献远大于高值互信息特征，成为影响最大的特征。

基于多特征自适应融合的智能生成文本检测方法

郑嘉丽, 周刚, 陈静, 李顺航

2026, 46(5): 1433-1440. DOI: 10.11772/j.issn.1001-9081.2025050657

摘要 ( )

HTML ( )

PDF (1662KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对大语言模型（LLM）快速发展导致智能生成文本信息高度拟真、传统检测方法性能下降的问题，提出一种基于多特征自适应融合的智能生成文本检测方法。该方法首先构建涵盖文本统计特征、语言结构性特征及语言不确定性特征的语言风格特征集，捕捉真实文本与生成文本的差异；再利用独立编码技术提取文本的深层语义特征。在此基础上，设计一种双路映射特征自适应融合策略，先将语言风格特征与深层文本语义特征初步融合，再基于深度学习方法进行二次融合，增强特征自适应融合能力。实验结果表明：所提方法在中文SocialAI-Detect数据集与英文TuringBench数据集上的检测准确率分别达到98.1%和98.5%，与基线方法中性能表现最好的J-Guard（Journalism Guided adversarially robust detection of AI-generated news）相比，分别提升了2.3与2.1个百分点，验证了所提方法的有效性。

基于大语言模型的双通道特征融合表示的短文本聚类方法

王倩飞, 李旸, 李德玉, 王素格

2026, 46(5): 1441-1449. DOI: 10.11772/j.issn.1001-9081.2025050716

摘要 ( )

HTML ( )

PDF (833KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对当前短文本聚类中全局语义表示不足和局部区分性弱等问题，提出一种基于大语言模型（LLM）的双通道特征融合表示的短文本聚类方法（DCFF）。该方法从全局视角建立基于语义增强的伪标签对比学习模块，利用LLM生成关键词并与原始文本动态加权融合以增强语义表示；进一步利用自适应最优传输生成高置信度伪标签，并结合类内紧密度与类间可分性约束，采用端到端的训练方式建立全局语义一致的向量表示；从局部视角建立基于熵和差异度的三元表示优化模块，通过熵和差异度筛选高信息量样本，并利用置信度加权损失与去噪机制微调嵌入模型，生成局部判别性强的向量表示。最后，建立基于自注意力机制的全局与局部信息融合语义表示直接用于聚类算法。在8个公开短文本聚类数据集上与主流基线的对比实验结果显示，DCFF在所有数据集上的准确率均优于基线，其中在GoogleNews-T数据集上的提升至少3.19个百分点；在6个数据集上的聚类一致性（NMI）指标优于基线，其中在SearchSnippets数据集上的提升至少3.46百分点。实验结果表明DCFF适用于多场景下的聚类任务。

基于层次化自适应融合机制和类别边界蒸馏的持续少样本事件检测模型

胡婕, 徐彤, 张龑

2026, 46(5): 1450-1459. DOI: 10.11772/j.issn.1001-9081.2025050583

摘要 ( )

HTML ( )

PDF (838KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对持续少样本事件检测（CFED）任务中面临的灾难性遗忘与小样本泛化难题，提出一种基于层次化自适应融合机制与类别边界蒸馏的CFED模型。首先，引入特征重构，结合全局平均池化与可学习映射，增强文本表征的结构建模能力并优化其特征分布；其次，设计层次化自适应融合机制，动态整合预训练模型浅层、中层与深层特征，引入高斯扰动增强特征鲁棒性，并通过自注意力机制实现跨层次特征的自适应加权融合；最后，提出类别边界蒸馏策略，利用KL（Kullback-Leibler）散度对齐新旧任务类别分布，结合余弦相似度优化决策边界特征，缓解知识遗忘。在数据集MAVEN和ACE2005上与9个基线模型以及大语言模型GPT-3.5-Turbo进行实验对比，结果表明所提模型在MAVEN上4?way 5-shot和4-way 10-shot的5个子任务平均F1值比次优模型HANet（Hierarchical Augmentation Networks）分别提升了2.92和1.80个百分点；在ACE2005上2-way 5-shot和2-way 10-shot的5个子任务平均F1值比次优模型HANet和Combined Retrain分别提升了1.83和2.00个百分点；相较于GPT-3.5-Turbo，所提模型在MAVEN上2-way 1-shot和2-way 2-shot的平均F1值分别提升了3.47和8.77个百分点，在ACE2005上分别提升了4.37和2.39个百分点，验证了该模型性能更优。

融合全局和局部语义的司法要素抽取方法

黄雨倩, 黄辉, 秦永彬, 黄瑞章, 陈艳平, 周裕林, 孙倩

2026, 46(5): 1460-1467. DOI: 10.11772/j.issn.1001-9081.2025050558

摘要 ( )

HTML ( )

PDF (1660KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

司法领域的信息抽取是从司法文书中提取出细粒度的关键要素，可辅助司法工作者高效处理大量文书工作。然而，相较于通用领域，司法文书中的要素通常具有长度较长、语义分布广泛的特点，同时细粒度要求对局部细节的提取尤为严格。这使得模型不仅需要具备处理长距离依赖的能力，还需在局部范围内精准捕获细粒度的语义信息。针对该问题，提出一种融合全局和局部语义的司法要素抽取方法。首先，拼接要素标签与司法文书内容，并利用BERT（Bidirectional Encoder Representations from Transformers）模型进行深度嵌入。其次，引入自注意力机制增强模型对全局上下文的理解能力；同时，利用自适应多头注意力机制动态调节关注权重，确保能获取到更丰富且准确的语义特征。最后，结合二元交叉熵损失函数和高斯分布平滑边界的KL（Kullback-Leibler）散度损失函数，提升模型对要素边界识别的泛化能力。实验结果表明，与序列标注方法、跨度抽取方法及其他方法相比，所提方法在LAIC2023、CAIL2021司法要素抽取数据集上的F1值均有提升，其中在LAIC2023数据集上比次优模型DiffusionNER高2.88个百分点，在CAIL2021数据集上比次优的机器阅读理解（MRC）模型高1.01个百分点。

基于深度学习的电网企业专利价值评估

盛兴, 翁孙贤, 陈扩松, 王忠平, 任芮锋, 刘勇

2026, 46(5): 1468-1474. DOI: 10.11772/j.issn.1001-9081.2025070850

摘要 ( )

HTML ( )

PDF (756KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

专利价值评估是优化资源配置、指导知识产权战略决策的重要手段，但传统人工评估方法受限于专家主观经验、评估效率低下等不足，难以适应数字经济时代企业对于专利价值评估的规模化需求。近年来，机器学习技术凭借强大的高维特征提取优势，为专利价值评估范式的革新提供了技术可行性。然而，现有研究多聚焦于单一技术维度的小规模模型，尚未充分探索大语言模型（LLM）在价值指标量化中的潜力，且现有方法难以适用于专利数据部分指标缺失的场景。针对电网企业专利数据库中的非结构化文本数据较难处理，部分专利价值指标不完整等问题，提出基于深度学习的电网企业专利价值评估方法，主要包括：利用LLM处理电网企业专利的非结构化文本信息；采取半监督学习（SSL）范式扩充用于训练的已标注专利数据库；通过集成学习方式在电网企业专利数据库上训练模型并进行专利价值评估。实证结果表明，所提方法能够高效评估电网企业专利价值，且评估误差较小。

竞争损失驱动的生成式不平衡节点分类

程凤伟, 张槟淇, 徐国华, 王文剑

2026, 46(5): 1475-1481. DOI: 10.11772/j.issn.1001-9081.2025050656

摘要 ( )

HTML ( )

PDF (1091KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

图神经网络（GNN）在节点分类任务中取得了显著成功，但它的性能通常依赖多数类丰富的标记数据，对标记稀缺的少数类节点可能存在表征偏差。传统过采样方法通过重复少数类样本可缓解类别不均衡，但容易导致局部邻域过拟合。近期研究尝试基于少数类锚点合成新节点，但未充分挖掘少数类与邻近类之间的关联信息，导致生成样本存在类边界模糊性问题。针对上述挑战，提出一种竞争损失驱动的生成式不平衡节点分类算法（GraphCG），设计特征-结构协同的辅助点筛选机制，通过融合节点特征与局部结构，精准定位可增强类边界的邻居类辅助点，并构造竞争性边界约束损失函数，以强制生成节点与多数类在嵌入空间中保持可分离的几何边界。实验结果表明，相较于当前的先进方法，GraphCG在多个类别不平衡数据集上表现出显著优势。GraphCG不仅可以增强数据的多样性，还可以提升类别可分性，避免少数类被多数类压制。

特征-标记邻域协同相关的分布式多标记特征选择方法

陶西沛, 鞠恒荣, 樊晓雪, 邹晓阳, 丁卫平

2026, 46(5): 1482-1489. DOI: 10.11772/j.issn.1001-9081.2025050567

摘要 ( )

HTML ( )

PDF (834KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统多标记邻域粗糙集将所有标记视为整体计算特征重要性，不能有效区分不同标记对特征选择的贡献差异，并且忽视了无关标记的噪声干扰问题，提出一种特征-标记邻域协同相关的分布式多标记特征选择方法（DML-FNCC）。首先，通过双向谱聚类同步挖掘标记与特征空间的内部关联，在标记空间提取具有决策代表性的标记主簇以降低噪声干扰，同时在特征空间构建基于语义相关性的谱聚类映射，实现高相关特征的模块化聚合；其次，考虑邻域依赖度量化特征簇与标记簇关联程度，筛选出与各标记簇最相关的特征子集；最后，采用分布式框架将计算任务分散到多个节点，进一步加速模型训练过程。在12个公开数据集上的实验结果表明，与现有多标记特征选择方法PMLFS（Partial Multi-Label Feature Selection）、WFDP（Weak-label Fuzzy Discernibility Pairs）等相比，DML-FNCC在平均精度、汉明损失、单错误率和排序损失以及覆盖度指标上均排名第一，分类性能得到有效提升。

基于用户中心的专家社区构建及推荐应用

杨仕杰, 刘忠慧, 闵帆

2026, 46(5): 1490-1498. DOI: 10.11772/j.issn.1001-9081.2025050639

摘要 ( )

HTML ( )

PDF (740KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对网络形式背景下基于社区推荐的方法会造成冗余推荐、时间复杂度过高的问题，提出一种以用户为中心的专家社区构建算法（ECCA）和基于专家社区的推荐算法（ECBRA）。首先，确定专家节点的筛选办法，设计由网络结构和正向评分共同构成的节点综合影响力，将综合影响力较大的节点选为专家节点；其次，构建每个用户的专家社区，由用户节点与它邻接的所有专家节点共同组建专家社区，保障所有用户均有自己独立的专家社区；最后，基于专家社区进行推荐，结合用户偏好设计动态和静态推荐置信度阈值，两阈值相加可得到推荐置信度阈值，再通过推荐置信度计算实现针对每个用户的个性化推荐。与基于弱概念相似度的组推荐算法（GRAWS）的比较结果表明，ECBRA综合用时仅为GRAWS的0.1%，无推荐冗余；在9个真实数据集与经典的协同过滤算法k最近邻（kNN）、基于项目的协同过滤（IBCF），以及基于概念集合的推荐（CSBR）算法、基于概念集的个性化推荐算法（CSPR）、结合形式概念分析与kNN的推荐（GreConD-kNN）算法的对比结果也表明，ECBRA效果较好，特别是在Netflix2数据集上，比CSPR算法的召回率高63.3%、F1值高13.9%，比kNN算法的F1值高62.7%。整体而言，ECBRA推荐冗余少，且时间复杂度低。

基于混合自注意力和差异归一化的长时间序列预测

宋芮芮, 王雷春, 何运平, 魏金香, 卢祥凤, 刘小萌

2026, 46(5): 1499-1506. DOI: 10.11772/j.issn.1001-9081.2025050628

摘要 ( )

HTML ( )

PDF (850KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对长时间序列预测中存在的误差积累、建模困难和计算效率低的问题，提出一种基于混合自注意力和差异归一化的长时间序列预测模型HSADN（Hybrid Self-Attention and Differentiated Normalization）。首先，模型使用堆叠多头自注意力机制捕捉编码器中时间序列的长距离依赖，降低计算复杂度，并使用多层稀疏自注意力机制动态调整解码器中的生成策略；其次，在编码器中通过批量通道归一化（BCN）对特征进行提取、融合和重构，在解码器中通过层归一化（LN）缓解梯度消失和提升训练稳定性，输出预测序列值。实验结果表明，与CALF（Cross-modAl Large Language Model Fine-tuning）模型相比，HSADN的单变量预测的均方误差（MSE）与平均绝对误差（MAE）在ECL-960上分别降低6.2％和6.9%，在ETTh-720上分别降低13.1％和2.9%；多变量预测的MSE和MAE在ETTm-672上分别降低3.5％和2.6%，在Weather-720上分别降低1.8％和0.9%；在单变量和多变量预测时的运行时间分别平均降低4.6%和28.7%。

基于时间依赖建模的动态贝叶斯网络交通预测

郭慧洁, 窦天凤, 张振琳, 亓开元, 吴栋, 曲志坚, 李钊, 任崇广

2026, 46(5): 1507-1517. DOI: 10.11772/j.issn.1001-9081.2025050570

摘要 ( )

HTML ( )

PDF (1117KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

精准的交通预测不仅能提升交通系统的效率与安全性，还能促进社会和经济的可持续发展。尽管已有大量研究致力于建模时空相关性，但现有方法仍然存在明显不足：大多数模型倾向于集体预测所有区域在所有时间段的交通流量，忽略了时空异质性，特别是当前区域的交通状态对相关区域未来交通状态的影响。为了解决这一问题，提出基于时间依赖建模的动态贝叶斯网络交通预测（TIDBN）方法。TIDBN通过预训练模块，利用时变动态贝叶斯网络捕捉时间序列数据中由于同时和滞后影响而产生的复杂时序关系。为了进一步提升对时空相关性的捕捉能力，引入时空注意力机制进行深入分析；随后，采用图卷积网络（GCN）对时空拓扑结构进行建模，以生成更准确的交通预测。实验结果表明，TIDBN在2个真实的交通预测任务中均表现优异，尤其在1 h预测中，它在数据集PeMS-BAY上的平均绝对误差（MAE）比基线次优方法降低了4%。

社会意识多智能体协同决策的隐私增强策略VLMDs-Privacy

王云乐, 冯翔, 虞慧群

2026, 46(5): 1518-1525. DOI: 10.11772/j.issn.1001-9081.2025050654

摘要 ( )

HTML ( )

PDF (1329KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

具有社会意识的多智能体系统（MAS）依赖领导结构提升协同决策效率，但易引发基于马尔可夫决策过程（MDP）状态轨迹分析的隐私泄露风险，导致关键节点遭受定向攻击。为此，提出虚拟领导人最小依赖隐私保护策略（VLMDs-Privacy），通过以下方法实现MAS安全高效的协同决策：1）设计状态转移自适应差分隐私机制（STADP），建立状态转移概率与隐私预算的动态映射关系，保护MDP状态轨迹免受逆向推理攻击；2）开发虚拟领导人最小依赖策略（VLMDs），在降低对虚拟领导人依赖的同时实现全局最优决策，显著提升系统抗单点故障能力；3）构建隐私-效率双重调节机制，基于智能体行为可信度动态分配隐私预算，自适应权衡社会意识与隐私保护。实验结果表明，在强隐私约束（ $ε$ =0.1）下，VLMDs-Privacy在导航、动态维修等场景中的平均到达成功率达94.2%，较传统领导人差分隐私方案VLDPs-Privacy （27.9%）提升66.3个百分点，相较于非隐私保护场景仅降低3.3%。该结果验证了VLMDs-Privacy在强隐私约束下维持系统协作能力与隐私保护效能的鲁棒性，可为开放环境中隐私敏感型MAS的协同决策提供理论和技术支撑。

以太坊经典网络双自私矿工策略的马尔可夫链模型与收益分析

王俊岭, 边俊君, 刘佳年, 徐志强

2026, 46(5): 1526-1533. DOI: 10.11772/j.issn.1001-9081.2025050596

摘要 ( )

HTML ( )

PDF (876KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

自私挖矿通过隐蔽挖掘和延迟发布新区块，扰乱区块链网络的正常共识过程，导致分叉率上升和系统效率降低。为量化分析多攻击者环境下自私挖矿对以太坊经典（ETC）网络的影响，针对ETC网络中特有的叔块和侄块奖励机制，构建包含多攻击者交互的马尔可夫链模型，定量分析了不同场景下矿工群体的收益动态。实验结果表明，在攻击者算力达到0.3时，双自私矿池协同攻击使废块率从26.35%提升至36.21%，系统吞吐量（每秒交易量（TPS））从20.15降至16.44。与单自私矿工情形相比，该攻击策略进一步提升了攻击者的相对收益，同时加剧了诚实矿工收益受损、废块率上升以及系统效率下降等问题。研究结果揭示了多攻击者自私挖矿的复杂收益机制，为设计针对性防御策略提供了理论基础和量化依据。

VU-RED-F：改进U-RED的单视角点云CAD模型替换

樊耿鑫, 韩慧妍, 况立群, 晋紫阳, 赵华峰

2026, 46(5): 1534-1544. DOI: 10.11772/j.issn.1001-9081.2025050575

摘要 ( )

HTML ( )

PDF (4107KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在机器人环境感知任务中，单视角点云因传感器视角受限导致几何信息严重缺失。基于计算机辅助设计（CAD）模型替换的点云重建方法通过检索相似模型并实施变形，可有效规避直接从点云中重建的结构失控风险。无监督三维形状检索与变形（U-RED）算法在保持重建结果可编辑性的同时可实现拓扑一致的CAD模型替换，但面对复杂拓扑结构物体时仍存在点云旋转平移不变性表征不足、同源部件间的几何相似性导致近邻部件区分困难、注意力权重分散以及梯度消失与爆炸引起的参数更新失效问题。针对上述挑战，在U-RED基础上提出基于向量神经元与特征仿射残差增强的无监督检索变形算法（VU-RED-F）。首先，构建向量神经元编码器（VNE），提升特征提取模块在点云旋转平移不变性表征的鲁棒性；其次，引入可学习的仿射变换残差以重构特征映射过程，自适应调整特征分布，增强网络对部件间局部几何结构的判别能力；最后，融合软阈值门控与残差校正，在约束注意力分布稀疏性的同时增强梯度传播稳定性，提升网络收敛效率，降低检索变形过程中的损失。在PartNet和ComplementMe合成数据集以及Scan2CAD真实数据集上的实验结果表明，VU-RED-F算法的平均倒角距离（cd）损失最小，提高了CAD模型的局部几何细节保真度。

基于线条图分割的三维部件装配方法

朱华泽, 王伟昊, 尤鸣宇, 周洪钧

2026, 46(5): 1545-1550. DOI: 10.11772/j.issn.1001-9081.2025050711

摘要 ( )

HTML ( )

PDF (872KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

三维部件装配是三维计算机视觉领域的重要任务，旨在对一组三维部件进行位姿估计，并将它们准确地组合成目标结构；但现有方法主要依赖大规模数据训练以及学习过往经验完成装配，泛化能力较弱，难以适应新的装配任务。为解决三维部件装配泛化性不足的问题，引入线条图形式的装配说明书作为辅助信息，希望机器人能够建立三维部件与二维线条图中区域的对应关系。建立这种对应关系面临诸多挑战：首先，装配体中通常有多个相同三维部件，而它们在二维线条图中的位置与姿态却各不相同，建立这种三维-二维对应关系对神经网络而言很困难；其次，线条图中部件存在相互遮挡，使三维-二维的对应关系更难建立。因此，提出一种基于线条图分割的三维部件装配方法，主要分为2个阶段：第一阶段利用点云信息对线条图进行部件实例分割，有效建立部件三维-二维的对应关系；第二阶段利用图卷积网络整合图像信息与分割结果，进行部件的位姿估计，完成装配任务。在PartNet数据集上与涵盖了单阶段、逐层组装、双阶段的3种基线方法开展对比，结果显示所提方法的部件装配准确率得到了普遍提升，验证了该方法的有效性。

基于外观-运动协同建模的视频异常检测

谢斌红, 朱二丹, 张睿

2026, 46(5): 1551-1559. DOI: 10.11772/j.issn.1001-9081.2025050571

摘要 ( )

HTML ( )

PDF (1731KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

视频异常检测目前面临以下挑战：一是在复杂环境中外观和运动信息融合不足，导致二者之间的语义关联缺失；二是模型过度依赖先验信息，导致有效特征表达能力弱化。因此，提出基于外观-运动协同建模的视频异常检测（AMC-VAD）方法。该方法通过像素级动态适配（PDA）模块实现外观与运动特征的逐像素权重调控，利用双分支深度可分离卷积（DWSConv）提取多尺度语义信息，并通过动态激活与残差连接增强特征融合的语义关联性；设计辅助记忆模块（AMM），采用查询驱动的语义对齐策略从记忆池提取原型特征，并结合动态聚合机制（DAM）强化查询特征的显著性表达，缓解先验信息覆盖导致的特征弱化；引入多样性损失函数优化记忆项分布的冗余性，提升模型对异常模式的判别能力。实验结果表明，AMC-VAD方法在UCSD Ped2和CUHK Avenue数据集上的接受者操作特征曲线下面积（AUC）分别为98.5%和88.5%，比AMMC-Net（Appearance-Motion Memory Consistency Network）分别提升了1.9和1.9个百分点，验证了该方法在复杂动态场景下的有效性。

基于场景概念引导特征融合的多波段图像描述生成方法

明文超, 蔺素珍, 晋赞霞

2026, 46(5): 1560-1567. DOI: 10.11772/j.issn.1001-9081.2025050631

摘要 ( )

HTML ( )

PDF (1049KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的图像描述模型在处理复杂场景下的多波段图像时，由于多波段图像的特征在空间上存在显著差异，直接使用简单的交叉注意力难以有效地对齐和融合这些特征；而且多波段图像成像原理的不同以及场景的复杂性，导致模型难以捕捉关键的视觉语义信息，生成的描述中会出现关键目标缺失、描述不完整的情况。针对上述问题，提出一种基于场景概念引导特征融合的多波段图像描述生成方法。首先，使用预训练的特征提取器Faster R-CNN（Faster Region-based Convolutional Neural Network）提取红外和可见光图像的区域特征，构建由场景概念引导的多波段特征对齐融合模块（FAFM）；其次，为了提高模型对视觉语义信息的建模能力，设计概念引导模块（CGM）为图像检索场景概念并进行编码；最后，构建自适应的门控机制（AGM），当解码器在每个时间步生成单词时，模型可以根据不同情况动态调整多波段图像的融合特征与概念特征的权重，从而实现特征的融合。在可见光图像-红外图像描述数据集上的实验结果表明，所提方法在BLEU-4（BiLingual Evaluation Understudy with 4-grams）和CIDEr（Consensus-based Image Description Evaluation）指标上分别达到56.7%和119.5%，较次优方法分别提高了1.1个和2.9个百分点。可见，所提方法能有效提高多波段图像描述的准确度。

基于两阶段协同优化的全色锐化

段佳欣, 胡靖, 文武, 余贞侠, 张永俊

2026, 46(5): 1568-1577. DOI: 10.11772/j.issn.1001-9081.2025050598

摘要 ( )

HTML ( )

PDF (2850KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

尽管基于深度学习的遥感图像全色锐化方法取得了一定进展，但它们多数依赖降采样数据进行监督训练，易受到尺度偏差影响，难以在全分辨率条件下保持性能稳定；相比之下，无监督方法可直接在全分辨率图像上优化，规避了降采样引发的问题，但由于缺乏明确的监督信号，方法的鲁棒性普遍较弱。因此，提出一种两阶段协同优化的全色锐化网络（TCONet）。第一阶段通过在降采样数据上进行监督训练，结合改进的多分辨率分析（IMRA）方法与注意力机制，提升空间细节与光谱保持能力；第二阶段构建无监督信息补偿网络（UICN），直接在全分辨率图像上优化，弥补尺度不一致带来的信息缺失。在4波段数据集QuickBird（QB）、8波段数据集WorldView-2 （WV-2）和4波段数据集WorldView-4 （WV-4）共3个卫星数据集上的实验结果表明，TCONet的视觉效果与评价指标均优于对比方法。

基于YOLO11改进的水下小目标检测算法CSAF-YOLO

张红瑞, 冯威铭, 杨潞霞, 马永杰

2026, 46(5): 1578-1585. DOI: 10.11772/j.issn.1001-9081.2025101310

摘要 ( )

HTML ( )

PDF (1783KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对水下小目标检测中光线散射、低对比度和复杂背景等挑战，提出一种基于YOLO11的改进算法CSAF-YOLO（Cross-Scale Adaptive Fusion YOLO）。首先，设计多尺度协同融合（MSCF）模块，通过空间融合与通道交互机制，增强多尺度特征间的协同作用，提升上下文信息提取能力；其次，构建动态内核尺度调制（DKSM）模块，自适应生成局部与全局调制矩阵，优化卷积核以增强模型对复杂水下环境的适应性；再次，提出多尺度增强检测头（MSE-Head），通过尺度感知增强和跨尺度特征动态融合，提高小目标定位精度；最后，引入MPDIoU（Modified Penalized Distance Intersection over Union）损失函数，通过最小点距离和多尺度惩罚机制，优化水下小型目标的边界框回归。在URPC2020数据集上的实验结果表明，CSAF-YOLO在50%交并比（IoU）阈值下的平均精度均值（mAP₅₀）达到了85.0%，比YOLO11高1.6个百分点，可为海洋资源勘探和水下机器人导航等领域的视觉任务提供有效的解决方案。

基于图Transformer和RT-DETR的轻量化水下小目标检测

吴闵奇, 杨元华, 李航, 胡雅琴, 汤智豪, 梅腾

2026, 46(5): 1586-1595. DOI: 10.11772/j.issn.1001-9081.2025050565

摘要 ( )

HTML ( )

PDF (2938KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的水下小目标检测方法多基于深度学习算法，难以兼顾轻量化与检测精度，无法满足实时性和资源受限水下平台的需求。因此，提出一种基于RT-DETR（Real-Time DEtection TRansformer）和图Transformer的轻量化水下小目标检测模型Graph-DETR。该模型采用大型可分离核注意力机制（LSKAttention）和上下文混合的动态卷积块（CM block）改进的轻量级MobileNetV4作为主干网络，以提升特征提取效率，降低模型复杂度。同时，提出层次化图Transformer金字塔网络（GTFPN）增强多尺度特征融合，并通过小波变换卷积（WTConv）、自适应下采样（Adown）和路径剪枝改进混合编码器，低参数化扩展基于CNN的跨尺度特征融合（CCFF）模块的卷积感受野。在水下公开数据集URPC2020上的实验结果表明，Graph-DETR的参数量比RT-DETR减少66.9%，推理延迟缩短6.8 ms，检测平均精度均值（mAP）达到53.2%，交并比（IoU）阈值为0.5时的平均精度（AP@0.5）为86.8%；在URPC2021上，Graph-DETR的召回率达到81.3%，mAP为54.1%，AP@0.5为87.6%，均超越了对比方法，且推理延迟仅10.5 ms。Graph-DETR展现出优越的水下小目标检测性能，具备实际部署在计算资源受限水下平台的应用前景。

基于双谱非线性特征耦合的语音增强方法

余正涛, 栾逸雪, 王文君, 董凌, 相艳, 高盛祥

2026, 46(5): 1596-1603. DOI: 10.11772/j.issn.1001-9081.2025050674

摘要 ( )

HTML ( )

PDF (1186KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对当前基于时频域的语音增强方法普遍通过短时傅里叶变换（STFT）后利用频谱二阶统计量建模信号的线性特征，忽略了语音中潜在的高阶非线性交互信息的问题，提出一种基于双谱非线性特征耦合的语音增强方法（BNFC）。该方法采用编解码结构作为整体框架，在编码器后引入双谱特征提取模块，以获取三阶统计量所揭示的相位耦合与非线性结构信息；并通过跳跃连接与编码器特征融合，实现更深层次的幅度与相位建模。在VoiceBank+DEMAND数据集上的实验结果显示，BNFC在语音质量的感知评估（PESQ）指标上达到3.57，比基线模型BREM（Bispectral Refinement Enhancement Module）提升15.53%，在语音信号失真感知评分（CSIG）、背景噪声干扰评分（CBAK）和整体语音质量评分（COVL）指标上分别提升5.51%、3.08%和10.31%，验证了高阶非线性特征建模对语音增强任务的重要性。

面向航空装备关键零部件故障诊断的知识图谱构建与应用

赵荣慧, 邓超, 余紫东

2026, 46(5): 1604-1613. DOI: 10.11772/j.issn.1001-9081.2025050586

摘要 ( )

HTML ( )

PDF (1334KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对航空装备关键零部件故障数据存在的专业性强、价值密度低、领域知识分散、缺乏有效整合利用方式等问题，以智能化故障诊断需求为驱动，引入知识图谱组织故障记录中蕴含的知识以便分享和重用，并研究故障知识图谱的构建和应用。首先，基于对先验故障知识和故障记录的分析，设计一种面向航空装备关键零部件的层次化故障诊断知识本体模型，该模型定义了实体类型及其关系约束，可有效避免实体边界不清楚的问题，为知识的结构化表示奠定基础；其次，提出一种改进的基于集合预测的知识抽取方法SPN-BiLSTM-CRF，直接从非结构化中文故障记录中高效抽取知识三元组集合，并以飞机部件液压柱塞泵为例构建液压柱塞泵故障知识图谱；最后，结合FP-Growth关联规则挖掘算法从故障知识数据集中提取故障模式与故障原因以及故障状态间的关联规则，并据此实现故障诊断。SPN-BiLSTM-CRF可有效解决故障数据的知识应用问题，为航空装备智能化运维提供知识驱动解决方案。

电动汽车锂离子电池预测-评估故障检测框架

廖雪超, 陈睿

2026, 46(5): 1614-1623. DOI: 10.11772/j.issn.1001-9081.2025050574

摘要 ( )

HTML ( )

PDF (1968KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对电动汽车锂离子电池故障检测中多源异构时序数据复杂性高、异常样本稀缺及多变量关联性强的挑战，提出一种基于动态变换记忆自编码器的预测-评估故障检测框架（DTMAD），以提升故障识别准确性与模型泛化能力。首先，设计融合动态自编码器（DyAD）与门控循环单元（GRU）的联合特征编码器，对多源时序数据进行特征融合与降维处理，提取跨模态深层特征表示；同时，构建基于自注意力机制的预响应编码器，捕捉时序数据中的长期依赖关系，提升特征提取效率与精度；进一步地，引入记忆解析模块，通过残差对比学习机制融合预测路径与实际响应路径，增强模型对异常模式的检测能力。其次，基于重构误差的分布特性，通过协同异常检测算法设计评估模型。最后，通过综合的预测-评估框架，在无监督学习条件下从多源数据中提取关键响应模式并识别潜在异常。在多组多源电动汽车锂离子电池数据集上的实验结果表明，所提框架的故障检测准确率和模型稳定性均优于对比的编码器（AE）、深度支持向量数据描述（DeepSVDD）与图偏差网络（GDN）等。其中，相较于DyAD模型，DTMAD模型的接收者操作特征曲线下面积（AUROC）提升至0.900 8，且结果波动幅度由0.029降至0.026，展现出更高的检测稳定性与泛化能力。

基于FHC-DETR的列车轴承滚子缺陷检测算法

贺元昊, 赵军

2026, 46(5): 1624-1633. DOI: 10.11772/j.issn.1001-9081.2025050592

摘要 ( )

HTML ( )

PDF (2299KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对列车轴承滚子缺陷检测中存在的小目标识别精度低和尺度变化大等问题，提出基于FHC-DETR（Fourier-fused High-low frequency interactive and Context-aware DEtection TRansformer）的检测算法。首先，针对模型计算复杂及小目标特征受噪声干扰的问题，设计频域特征提取模块C2f-FG（C2f with Fourier-Gated bottleneck）提取特征，通过傅里叶变换同步获取空间域局部特征与频域全局特征，二者融合可提高小目标检测精度并降低计算复杂度；其次，针对缺陷尺度变化导致的特征混淆，引入高低频特征交互模块HiLo（High-Low frequency），高频分支聚焦局部缺陷纹理，低频分支通过全局注意力捕捉整体语义，从而提升多尺度适应能力；再次，针对特征融合中存在的小目标特征衰减问题，构建上下文感知型多尺度双向特征金字塔网络（CM-BiFPN），通过动态感知上下文并强化跨层交互，减小特征传递损失，提升融合效率；最后，采用EMASlideVarifocalLoss自适应损失函数，动态调整分类阈值并优化难例权重，进一步提升定位与类别区分能力。实验结果显示，所提检测算法的平均精度均值（mAP）达91.5%，比实时检测变换器（RT-DETR）高2.3个百分点，且参数量减少28.1%，计算量降低23.0%，内存占用下降23.7%，实现了精度与效率的平衡，验证了它在工业场景的实用性。

基于小波域稀疏贝叶斯学习的非确定性MRI重建

崔凯燕, 魏舒娜

2026, 46(5): 1634-1646. DOI: 10.11772/j.issn.1001-9081.2025101275

摘要 ( )

HTML ( )

PDF (11465KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

磁共振成像（MRI）全采样扫描时间长，既制约检测效率，还易因受检者移动产生运动伪影。针对传统压缩感知MRI（CS-MRI）重建方法参数敏感性高、无法量化结果不确定性等问题，提出一种基于小波域稀疏贝叶斯学习（SBL）的非确定性MRI重建方法BU-MRI（Bayesian Uncertainty-guided MRI）。首先利用小波变换对图像进行多分辨率表征的优势，通过刻画MRI图像在小波域中的稀疏性作为先验，构建一个分层贝叶斯概率模型。其次，采用吉布斯（Gibbs）采样与边际似然最大化相结合的后验推断策略，实现对高维稀疏系数的有效估计与超参数的自适应更新。最后，基于更新后的模型参数，从欠采样的K空间数据中迭代恢复出高质量图像。此外，该方法还能够输出像素级的后验置信区间，为重建结果提供定量化的不确定性评估。仿真与真实MRI数据上的实验结果表明，BU-MRI方法的峰值信噪比（PSNR）与结构相似性指数（SSIM）优于零填充逆离散傅里叶变换（ZF-IDFT）和k-t鲁棒主成分分析（k-t RPCA）等方法；而且在真实心脏MRI数据和大脑MRI数据上，当采样率为0.5时，BU-MRI重建数据的PSNR分别达到44.42 dB和40.37 dB，SSIM分别达到0.976 5和0.954 7。BU-MRI方法在结构保真、误差抑制与频域一致性上表现优异，在不同采样率与噪声水平下收敛稳定且鲁棒性良好，能为临床MRI提供可靠且具备不确定性量化能力的重建框架。

融合图像纹理增强与超分辨率的染色体级联分类框架

彭文, 张博凯, 林金炜

2026, 46(5): 1647-1657. DOI: 10.11772/j.issn.1001-9081.2025050568

摘要 ( )

HTML ( )

PDF (1195KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

染色体核型分析在产前筛查和遗传疾病诊断中具有重要意义，但现有染色体分类模型普遍存在特征提取能力不足、图像质量敏感性强以及对局部细节感知不充分等问题，导致染色体整体分类准确率不高，尤其是短小染色体常常被错误识别。因此，提出一种融合图像纹理增强与超分辨率技术的染色体粗粒度-细粒度级联分类框架。首先，基于国际人类细胞遗传命名系统（ISCN）对染色体进行粗分类，将染色体划分为长染色体与短小染色体组，缓解类别不均衡与特征混淆问题；其次，针对长染色体分类任务，增加特征增强模块优化分类模型对长染色体的细节感知能力；随后，针对短小染色体图像的特点引入图像超分辨率技术，提升图像质量与模型感知能力。在私有数据集上的实验结果表明，所提框架的染色体整体分类准确率达到98.91%，整体F1分数达到98.77%，其中长染色体的F1分数为99.01%，短小染色体的F1分数为98.31%。该染色体级联分类框架针对不同分类任务采取差异化分类策略与分类模型，显著提升了染色体分类精度和模型鲁棒性。

MD-FVR：基于多域特征融合的级联手指静脉识别网络

张驰, 孟宪静, 窦长昊, 王倩, 耿蕾蕾, 袭肖明

2026, 46(5): 1658-1666. DOI: 10.11772/j.issn.1001-9081.2025050658

摘要 ( )

HTML ( )

PDF (1137KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有手指静脉识别方法主要关注空间域特征的提取，忽略了手指静脉血管作为管状树形结构在频率域的表达及其中蕴含的多尺度细节的问题，提出基于多域特征融合的级联手指静脉识别网络（MD-FVR），采用层次化的级联网络架构，每一层次由多域融合模块与基础操作构成，能实现特征的逐步提取和增强。其中，多域特征融合模块作为核心模块：首先，通过深度可分离小波卷积块（DSWC）增强结构信息；其次，利用频率域-空间耦合块（FDSC）提取频率域全局特征，弥补空间域表达的不足，并结合改进的半小波-空间注意力块（HWSA）进一步细化频率域细节的表征；最后，通过自适应特征融合模块（AFF）整合多域特征，得到最终的增强特征表示。在HKPU与SDUMLA-HMT数据集上的实验结果显示，MD-FVR识别准确率分别达到了99.68%和99.53%，且等错误率（EER）仅为0.35%和0.41%。与现有的仅在空间域或频率域提取特征的方法相比，MD-FVR方法在识别准确性与鲁棒性方面均表现出显著的优势。

引入自动提示编码器的SAM睑板腺统一密集分割方法

荆莹, 李然, 蒋卓, 付子扬, 杜晶颐, 刘琪, 刘吉航

2026, 46(5): 1667-1676. DOI: 10.11772/j.issn.1001-9081.2025050613

摘要 ( )

HTML ( )

PDF (3389KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统SAM（Segment Anything Model）在睑板腺图像分割中依赖人工提示，难以应对腺体密集、形态不规则及边界模糊的问题，提出改进模型ResSAM。该模型引入自动提示编码器消除人工干预的依赖；针对骨干网络进行剪枝优化，进一步提升模型分割效率；采用Focal Loss和Smooth IoU Loss优化训练，并融合SE（Squeeze-and-Excitation）与交叉注意力机制降低个体差异和边界模糊的影响，提升模型分割精度。在2个自建数据集Lower Lid和Upper Lid上的实验结果显示，ResSAM的参数量和十亿次浮点运算次数（GFLOPs）指标表现最优；分割结果具有最高Dice值，分别为88.69%和87.75%，以及最高的交并比（IoU）值，分别为79.69%和78.58%。研究结果表明，ResSAM在效率与精度方面均实现了优化，可为睑板腺功能障碍（MGD）的早期预防和临床诊断提供支持。

基于特征融合和通道信息补偿的中草药细粒度图像分类

刘馨瑶, 梁军, 龙嘉濠, 颜仁梁

2026, 46(5): 1677-1683. DOI: 10.11772/j.issn.1001-9081.2025050632

摘要 ( )

HTML ( )

PDF (1212KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在传统中草药细粒度图像分类领域，缺乏一个全面且平衡的数据集。为推进中草药细粒度图像识别研究，构建了Herb-150细粒度中草药数据集，该数据集样本分布均衡且每个类别包含数量相当的样本。针对中草药细粒度图像识别任务中深层神经网络易丢失判别性细节特征的问题，提出细粒度特征增强的CHMRN（Chinese Herbal Medicine Recognition Network），通过引入自顶向下的特征融合模块整合多尺度语义信息捕捉全面的上下文特征；同时，设计自底向上的通道特征信息补偿模块，以增强细粒度特征的表达能力，确保准确捕捉中药类别之间的细微差异。实验结果表明，CHMRN在Herb-150数据集上的准确率达到93.910%，优于对比的CMAL-Net（Cross-layer Mutual Attention Learning Network）等主流模型，验证了它在细粒度分类任务中的有效性。CHMRN不仅提高了传统中药识别的准确性，还能为类似的细粒度图像分类应用提供参考。

基于TransNeXt的粮食不完善粒图像高精度识别方法

袁淼淼, 褚毅宏, 尹冠军, 邓春华

2026, 46(5): 1684-1691. DOI: 10.11772/j.issn.1001-9081.2025050593

摘要 ( )

HTML ( )

PDF (1355KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有深度学习方法在高精度粮食不完善粒识别研究中仍面临以下问题：不完善粒的关键判别特征局部分布于尺度不一、位置随机的图像区域，模型难以稳定、全面地感知这些区域；多类不完善粒的细粒度判别特征表达形式多样，统一建模路径难以同时优化所有类别的识别性能。因此，基于TransNeXt架构提出了一种全局引导的两阶段局部特征学习框架，在整图感知的基础上提取关键判别区域的深层表征，并在该区域上完成细粒度特征建模。进一步针对不同类别构建独立优化的网络分支，多个分支共享主干网络，实现对多类目标的高效适配与轻量扩展。为支撑上述方法，构建了一个覆盖多粮食品种并具备标准化类别与判别区域位置标注的不完善粒数据集。实验结果表明，所提方法在测试集上达到了99.62%的准确率，验证了它在复杂细粒度图像识别任务中的有效性与可扩展性。

基于线性可变形卷积与双域协同动态注意力的矿石图像分割

胡静, 陈世堃, 王芳, 张睿, 王勇

2026, 46(5): 1692-1702. DOI: 10.11772/j.issn.1001-9081.2025050645

摘要 ( )

HTML ( )

PDF (2625KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对矿石图像在分割任务中因纹理复杂、形态不规则以及光照不均导致的边界模糊与精度不足问题，提出一种基于线性可变形卷积（LDConv）与双域协同动态注意力的分割网络LDDA-Net（Linear Deformable Dual-domain Attention Network）。该网络采用编码器与解码器架构，在串行双重特征编码器中通过LDConv构建自适应采样点分布，灵活拟合矿石的不规则形态，并且凭借LDConv的线性特性有效控制计算开销；其次，针对空间域特征设计动态注意力调制（DAM）模块，通过池化采样、可学习注意力矩阵和边界敏感权重分配机制实现特征图中关键信息与矿石边缘的动态聚焦和强化；最后，提出一种新的动态渐进式注意力引导损失函数（DPAG Loss），通过多阶段动态生成注意力图，引导模型在训练过程中聚焦模糊边界与小颗粒矿石等难分割区域，并与DAM模块形成空间-损失双域协同，构建特征感知与学习策略的反馈闭环机制。在自建露天矿石数据集（OpenPitOre Dataset）与公开矿石数据集（Ore dataset）上的实验结果表明，LDDA-Net的豪斯多夫-95距离（HD95）边界误差仅16.84 mm，相较于次优模型VM-Unet降低了11.37%；Dice系数高达91.54%，平均交并比（mIoU）和像素准确率（PA）分别为85.13%和94.10%，均显著优于对比分割模型。LDDA-Net在复杂场景下可实现高精度与精细化分割效果，可为露天爆破矿石的智能检测与块度分析提供可靠的技术支撑。

当期目录