当期目录

    2025年 第45卷 第8期 刊出日期:2025-08-10
    2024年全国开放式分布与并行计算学术年会 (DPCS 2024)
    联邦学习的高效性研究综述
    葛丽娜, 王明禹, 田蕾
    2025, 45(8):  2387-2398.  DOI: 10.11772/j.issn.1001-9081.2024081119
    摘要 ( )   HTML ( )   PDF (702KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    联邦学习作为一个分布式机器学习框架,解决了数据孤岛问题,对个人及企业的隐私保护起到了重要作用。然而,由于联邦学习的特点,效率问题(尤其是高昂的成本)仍旧是目前急需解决的,这一现状仍不尽如人意。因此,全面调研并总结当前主流的关于联邦学习高效性的研究。首先,回顾高效联邦学习的背景,包括它的由来以及核心思想,并解释联邦学习的概念和分类;其次,论述基于联邦学习而产生的高效性问题,并将它们分为异构性问题、个性化问题和通信代价问题;再次,在此基础上详细分析并论述高效性问题的解决方案,并将高效联邦学习研究分为模型压缩优化方法以及通信优化方法这2个类别后进行调研;继次,通过对比分析,总结各联邦学习方法的优缺点,并阐述目前高效联邦学习中仍存在的挑战;最后,给出高效联邦学习领域未来的研究方向。

    联邦学习中针对后门攻击的检测与防御方案
    苏锦涛, 葛丽娜, 肖礼广, 邹经, 王哲
    2025, 45(8):  2399-2408.  DOI: 10.11772/j.issn.1001-9081.2024081120
    摘要 ( )   HTML ( )   PDF (2521KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对联邦学习(FL)系统中普遍存在的恶意后门攻击行为,以及现有防御方案难以在隐私保护与模型训练的高准确率之间取得平衡的难题,探索FL中的后门攻击及其防御方法,提出一种名为GKFL (Generative Knowledge-based Federated Learning)的安全高效集成方案用于检测后门攻击并修复受损模型。该方案无需访问参与方的原始隐私数据,通过中央服务器生成检测数据检测联邦学习中的聚合模型是否遭受后门入侵,并采用知识蒸馏技术恢复受损模型,从而确保模型的完整性和准确性。在数据集MNIST和Fashion-MNIST上的实验结果表明,GKFL的总体性能均优于经典方案FoolsGold、GeoMed和RFA (Robust Federated Aggregation);GKFL比FoolsGold更能保护数据的隐私。可见,GKFL方案拥有检测后门攻击及修复受损模型的能力,并在模型中毒准确率和模型主任务准确率上明显优于对比方案。

    基于分布式环境的图神经网络模型训练效率与训练性能评估
    涂银川, 郭勇, 毛恒, 任怡, 张建锋, 李宝
    2025, 45(8):  2409-2420.  DOI: 10.11772/j.issn.1001-9081.2024081140
    摘要 ( )   HTML ( )   PDF (1623KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着图数据规模的快速增长,图神经网络(GNN)在处理大规模图结构数据时面临计算和存储方面的挑战。传统的单机训练方法已不足以应对日益庞大的数据集和复杂的GNN模型,分布式训练凭借并行计算能力和可扩展性,成为解决这些问题的有效途径。然而,一方面,已有的分布式GNN训练评估主要关注以模型精度为代表的性能指标和以训练时间为代表的效率指标,而较少关注数据处理效率和计算资源利用方面的指标;另一方面,算法效率评估的主要场景为单机单卡或单机多卡,而已有的评估方法在分布式环境中的应用相对简单。针对这些不足,提出针对分布式场景的模型训练的评估方法,涵盖评估指标、数据集和模型这3个方面。根据评估方法,选取3个代表性GNN模型,在4个具有不同数据特征的大型公开图数据集上进行分布式训练实验,并收集和分析得到的评估指标。实验结果表明,分布式训练中的模型架构和数据结构特征对模型复杂度、训练时间、计算节点吞吐量和计算节点平均吞吐量之比(NATR)均有影响;样本处理与数据拷贝占用了模型训练较多时间,计算节点互相等待的时间也不容忽视;相较于单机训练,分布式训练的计算节点吞吐量有显著降低,且需要进一步优化分布式系统中的资源利用。可见,所提评估方法为GNN模型在分布式环境中的训练性能优化提供了参考依据,并为模型的进一步优化和算法的改进奠定了实验基础。

    基于区块链的自动驾驶仿真测试数据存证模型
    彭海洋, 计卫星, 刘法旺
    2025, 45(8):  2421-2427.  DOI: 10.11772/j.issn.1001-9081.2024091280
    摘要 ( )   HTML ( )   PDF (2223KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对自动驾驶仿真测试中多参与者数据共享引发的安全性问题,提出一种基于区块链的自动驾驶仿真测试数据的存证模型,确保数据安全存储且具备可追溯性,进而为审计工作提供可靠支持。首先,利用联盟链的半公开特性确保链上数据仅对授权组织可见,同时利用基于RBAC (Role-Based Access Control)模型的权限校验机制实现针对这些组织的访问控制;其次,定义智能合约模板以规范数据存取流程,并开放流程扩展点以支持自定义功能,例如允许扩展关联合约以确保仿真资源交易行为的自动执行;最后,提出星际文件系统(IPFS)链上链下混合存储、数据批量处理和资源数据缓存等优化策略解决区块链存储资源和处理能力受限的问题。针对数据存证效率进行测试,并对大语言模型生成的500个仿真场景进行数据存证。实验结果表明,与直接存取方法相比,应用批量处理策略的存证过程的总事务量降低了72.00%,大幅减少了智能合约调用带来的性能消耗,而全量数据的写入和读取平均耗时分别降低了85.36%和52.67%。可见,所提模型为自动驾驶仿真测试中的多方数据共享的数据安全性提供了可靠的技术支持,而所提优化策略显著提高了数据的访存效率。

    面向区块链节点分析的eclipse攻击动态检测方法
    张硕, 孙国凯, 庄园, 冯小雨, 王敬之
    2025, 45(8):  2428-2436.  DOI: 10.11772/j.issn.1001-9081.2024081101
    摘要 ( )   HTML ( )   PDF (1546KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    eclipse攻击作为针对区块链网络层的一种显著威胁,通过控制节点的网络连接,可导致被攻击节点与整个网络的隔离,进而影响该节点接收区块和交易信息的能力。攻击者还可以在此基础上发起双重支付等攻击,这会对区块链系统造成巨大破坏。针对该问题,结合深度学习模型,提出一种面向区块链节点分析的eclipse攻击动态检测方法。首先,利用节点综合韧性指标(NCRI)表达节点的多维属性特征,并引入图注意力神经网络(GAT)动态更新网络拓扑结构的节点特征;然后,使用卷积神经网络(CNN)融合节点的多维特征;最后,结合多层感知机(MLP)来预测整体网络的脆弱性。实验结果表明,所提方法在不同的eclipse攻击强度下的准确率最高可以达到89.80%,并且能在不断变化的区块链网络中保持稳定的性能。

    基于SM2的无证书环签名方案
    汪玉, 郑明辉, 杨景奕, 黄世成
    2025, 45(8):  2437-2441.  DOI: 10.11772/j.issn.1001-9081.2024081108
    摘要 ( )   HTML ( )   PDF (919KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的基于SM2环签名方案存在私钥泄露的风险,不诚实的密钥生成中心(KGC)有能力监听和伪造实体间的通信,为了克服该不足,提出基于SM2的无证书环签名方案CLRS-SM (CertificateLess Ring Signing scheme based on SM2)。该方案中用户的私钥由各自独立的2部分组成,一部分是由KGC根据用户的身份和系统主密钥计算的用户的部分私钥,另一部分是用户自身随机选择的一个秘密值。因此,即使恶意KGC泄露部分私钥,攻击者也无法获得用户的整个私钥。该方案的安全性规约为离散对数问题,并在随机预言模型下证明了它具有不可伪造性和无条件匿名性。实验结果表明,与现有的基于SM2环签名方案相比,所提方案能以仅多出0.18%的计算量抵抗恶意密钥生成中心攻击,具有更高的安全性。

    第21届CCF中国信息系统及应用大会 (WISA 2024)
    自动化偏好对齐的双阶段提示调优方法
    冯涛, 刘晨
    2025, 45(8):  2442-2447.  DOI: 10.11772/j.issn.1001-9081.2024081083
    摘要 ( )   HTML ( )   PDF (2211KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    用户提示通常缺乏特定领域的专业性和术语的使用,这导致大型语言模型(LLM)难以准确理解意图并生成符合领域要求的信息。因此,提出一种自动化偏好对齐的双阶段提示调优方法(APADPT),解决LLM在垂直领域应用时面临的偏好对齐问题。APADPT通过构建包含人类偏好的监督微调数据集,并利用LLM进行成对回复的语义分析和评估,实现对输入提示的精细化调整。经过双阶段训练,模型不仅能掌握通用领域的提示优化规律,还可以针对垂直领域特性进行专业化调整。在医疗领域的实验结果表明,APADPT显著提升了基于API的LLM与开源LLM的偏好对齐一致性,在相同模型参数量条件下,平均胜率提高了9.5%~20.5%。此外,所提方法在不同参数规模的开源模型上均展现出了良好的鲁棒性和泛化能力,为LLM在垂直专业化领域中的应用提供了新的优化策略,并有助于在保持模型的泛化性和适应性的前提下提高模型的性能。

    跨模态信息融合的视频-文本检索
    习怡萌, 邓箴, 刘倩, 刘立波
    2025, 45(8):  2448-2456.  DOI: 10.11772/j.issn.1001-9081.2024081082
    摘要 ( )   HTML ( )   PDF (2509KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的视频-文本检索(VTR)方法通常假设文本描述与视频之间存在强语义关联,却忽略了数据集中广泛存在的弱相关视频文本对,导致模型虽然擅长识别常见的通用概念,但无法充分挖掘弱语义描述的潜在信息,进而影响模型的检索性能。针对上述问题,提出一种跨模态信息融合的VTR模型,该模型以跨模态的方式利用相关的外部知识改进模型的检索性能。首先,构建2个外部知识检索模块,分别用于实现视频与外部知识的检索以及文本与外部知识的检索,以便后续借助外部知识强化原始视频和文本的特征表示;其次,设计自适应交叉注意力的跨模态信息融合模块,以去除视频和文本中的冗余信息,并利用不同模态间的互补信息融合特征,学习更具判别性的特征表示;最后,引入模态间和模态内的相似性损失函数,以确保数据在融合特征空间、视频特征空间和文本特征空间下信息表征的完整性,从而实现跨模态数据间的精准检索。实验结果表明,与MuLTI模型相比,所提模型在公共数据集MSR-VTT (Microsoft Research Video to Text)和DiDeMo (Distinct Describable Moments)上的召回率R@1分别提升了2.0和1.9个百分点;与CLIP-ViP模型相比,所提模型在公共数据集LSMDC (Large Scale Movie Description Challenge)上的R@1提高了2.9个百分点。可见,所提模型能有效解决VTR任务中的弱相关数据的问题,从而提升模型的检索准确率。

    基于分布增强的深度变分文本聚类模型
    申奥, 黄瑞章, 薛菁菁, 陈艳平, 秦永彬
    2025, 45(8):  2457-2463.  DOI: 10.11772/j.issn.1001-9081.2024081100
    摘要 ( )   HTML ( )   PDF (2197KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对深度变分文本聚类模型在实际应用中遇到的分布信息缺失和分布坍塌问题,提出一种基于分布增强的深度变分文本聚类模型(DVCMD)。该模型通过分布信息增强的方法,整合增强潜在语义分布至原始潜在语义分布,从而提高潜在分布的信息完整性和准确性;同时,采用分布一致性约束策略促使模型学习一致的语义表征,从而提高模型通过学习的语义分布对数据真实信息的表达能力,进而提升聚类性能。实验结果表明,与现有的深度聚类模型和结构语义增强聚类模型相比,DVCMD的归一化互信息(NMI)指标在Abstract、BBC、Reuters-10k和BBCSports这4个真实数据集上分别至少提升了0.16、9.01、2.30和2.72个百分点,验证了模型的有效性。

    多级邻域谓语标签树编码索引的资源描述框架图多元语义查询
    蒋建涛, 宋宝燕, 单晓欢
    2025, 45(8):  2464-2469.  DOI: 10.11772/j.issn.1001-9081.2024081164
    摘要 ( )   HTML ( )   PDF (2416KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    知识图谱是揭示实体之间关系的语义网络,常以资源描述框架(RDF)的形式表示。面对爆炸式增长的海量信息,现有的RDF图上的语义查询算法忽略了多元化的语义查询需求,因此,充分考虑RDF图丰富的语义信息,提出一种分布式处理的多级邻域谓语标签树编码索引(NPLTE)的RDF图多元语义查询方法(DSQ-NPLTE)。首先,为了避免存储空间的浪费且辅助后续的并行查询,设计基于频度的谓语编码映射策略,从而将较长字符串表示的谓语映射为唯一的自然数表示;其次,将RDF图分割后,将得到的顶点按它的邻边特性进行分类,并给出相应的存储模式;再次,构建多级NPLTE,利用谓语特征信息过滤无效顶点及边;最后,针对谓语已知、主语(宾语)已知和混合已知的多元语义查询,给出相应的匹配策略,并提出基于公共点的优化连接以减少笛卡儿积的数量,从而降低连接代价。实验结果表明,相较于无预处理方式,通过利用构建的索引进行剪枝优化,所提方法的查询效率可提高5~9倍;在3个不同规模的LUBM标准合成数据集上,与查询性能较好的FAST方法相比,所提方法的查询效率平均提高了43%。可见,构建的索引及查询策略可有效处理大规模RDF图上的多元化语义查询。

    基于特征组合的异构图注意力网络关系抽取
    闫家鑫, 陈艳平, 杨卫哲, 黄瑞章, 秦永彬
    2025, 45(8):  2470-2476.  DOI: 10.11772/j.issn.1001-9081.2024081076
    摘要 ( )   HTML ( )   PDF (1228KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    关系抽取旨在从句子中提取2个实体之间的预定义语义关系。传统基于图神经网络的关系抽取方法一般通过依赖树构建句子的图表示结构;然而,使用依赖树构建出的图结构表达能力单一,且无法完整捕捉到目标实体丰富的语法结构信息。针对这些问题,提出基于特征组合的异构图注意力网络(HGAT)关系抽取方法。首先,抽取句子中的原子特征,并通过组合这些原子特征得到句子的组合特征;其次,把组合特征和关系标签表示为异构图上的两种节点以构建“特征-关系二部图”;最后,使用图注意力网络动态地更新节点,进而实现关系抽取。所提方法能有效利用组合特征和句子中的语法结构信息,进而提升关系抽取的性能。在ACE05英文数据集和SemEval-2010 task 8数据集上的实验结果表明,所提方法分别达到了84.11%和90.67%的F1值,证明了所提方法的有效性。

    多约束条件下钢铁物流车货匹配的多目标优化
    俞凯乐, 廖家俊, 毛嘉莉, 黄小鹏
    2025, 45(8):  2477-2483.  DOI: 10.11772/j.issn.1001-9081.2024081125
    摘要 ( )   HTML ( )   PDF (1550KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    钢铁物流平台在处理客户订单时,常需将钢材产成品拆分成多个运单运输,而未达到货车最低载重限制(LTL)的“尾货”通常需要与其他客户订单的货物拼载以优化运输效率。尽管之前的研究已经提出一些拼载决策的解决方案,但均未能同时考虑拼货运输中可能产生的绕行距离以及高优先级货物优先发运的问题。因此,提出一个多约束条件下多目标优化的钢铁拼载决策框架。通过设计分层决策网络和表征增强模块实现全局最优的拼货决策。具体地,采用基于近端策略优化(PPO)的分层决策网络,先确定各个优化目标的优先级,再基于这些优先级进行尾单的组合与选择;同时,利用基于图注意力网络(GAT)的表征增强模块实时表征货物信息和尾货信息,并将这些信息输入决策网络以实现多目标的长期收益最大化。在大规模真实货运数据集上的实验结果表明,与其他在线方法相比,所提方法与仅最大化承运量的尾单拼货方法相比,在发运总重量减少6.75%的前提下,分别实现了高优先级货物重量占比和平均绕行距离比次优的贪心算法提升17.3%和降低7.8%,有效提升了拼载运输的效率。

    人工智能
    深层语义特征增强的ReLM中文拼写纠错模型
    张伟, 牛家祥, 马继超, 沈琼霞
    2025, 45(8):  2484-2490.  DOI: 10.11772/j.issn.1001-9081.2024071015
    摘要 ( )   HTML ( )   PDF (1067KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    ReLM (Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM (Feature-enhanced Rephrasing Language Model)。该模型利用深度可分离卷积(DSC)技术融合特征提取模型BGE(BAAI General Embeddings)生成的深层语义特征与ReLM生成的整体特征,从而有效提升模型对复杂上下文的解析力和拼写错误的识别纠正精度。首先,在Wang271K数据集上训练FeReLM,使模型持续学习句子中的深层语义和复杂表达;其次,迁移训练好的权重,从而将模型学习到的知识应用于新的数据集并进行微调。实验结果表明,在ECSpell和MCSC数据集上与ReLM、MCRSpell (Metric learning of Correct Representation for Chinese Spelling Correction)和RSpell(Retrieval-augmented Framework for Domain Adaptive Chinese Spelling Check)等模型相比,FeReLM的精确率、召回率、F1分数等关键指标的提升幅度可达0.6~28.7个百分点。此外,通过消融实验验证了所提方法的有效性。

    改进语言规则中的表示的隐喻识别
    杨青, 朱焱
    2025, 45(8):  2491-2496.  DOI: 10.11772/j.issn.1001-9081.2024071037
    摘要 ( )   HTML ( )   PDF (768KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的隐喻识别任务研究工作多采用深度学习技术,而并未深入利用语言学规则,主要表现为规则中涉及的目标词的语义与基本义的表征存在缺陷,导致相关模型无法聚焦目标词与更相关上下文词之间的差异,且基本义与上下文含义界限仍然模糊。针对上述问题,提出一种改进语言规则中的表示的隐喻识别模型(MeRL)。首先,增强选择偏好违反(SPV)和隐喻识别过程(MIP)规则都涉及目标词的语义表示;其次,表征MIP规则中的目标词的基本义;最后,融合基于规则设计的SPV与MIP模块来共同识别隐喻。相较于MelBERT(Metaphor-aware late interaction over BERT)等基线模型,在基准数据集VUA-18、VUA Verb、MOH-X上的实验结果表明,所提模型的F1值分别至少提高了0.6、0.9、1.2个百分点,表明该模型识别隐喻更准确;在TroFi数据集上进行zero-shot迁移学习的结果显示,所提模型的F1值至少提高了0.7个百分点,表明该模型的泛化能力更强。

    分布外检测中训练与测试的内外数据整合
    王祉苑, 彭涛, 杨捷
    2025, 45(8):  2497-2506.  DOI: 10.11772/j.issn.1001-9081.2024081141
    摘要 ( )   HTML ( )   PDF (1773KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    分布外(OOD)检测旨在识别偏离训练数据分布的外来样本,以规避模型对异常情况的错误预测。由于真实OOD数据的不可知性,目前基于预训练语言模型(PLM)的OOD检测方法尚未同时评估OOD分布在训练与测试阶段对检测性能的影响。针对这一问题,提出一种训练与测试阶段整合内外数据的OOD文本检测框架(IEDOD-TT)。该框架分阶段采用不同的数据整合策略:在训练阶段通过掩码语言模型(MLM)在原始训练集上生成伪OOD数据集,并引入对比学习增强内外数据之间的特征差异;在测试阶段通过结合内外数据分布的密度估计设计一个综合的OOD检测评分指标。实验结果表明,所提方法在CLINC150、NEWS-TOP5、SST2和YELP这4个数据集上的综合表现与最优基线方法doSCL-cMaha相比,平均接受者操作特征曲线下面积(AUROC)提升了1.56个百分点,平均95%真阳性率下的假阳性率(FPR95)降低了2.83个百分点;与所提方法的最佳变体IS/IEDOD-TT (ID Single/IEDOD-TT)相比,所提方法在这4个数据集上的平均AUROC提升了1.61个百分点,平均FPR95降低了2.71个百分点。实验结果证明了IEDOD-TT在处理文本分类任务时针对不同数据分布偏移的有效性,并验证了综合考虑内外数据分布的额外性能提升。

    依赖类型及距离增强的方面级情感分析模型
    赵彪, 秦玉华, 田荣坤, 胡月航, 陈芳锐
    2025, 45(8):  2507-2514.  DOI: 10.11772/j.issn.1001-9081.2024081088
    摘要 ( )   HTML ( )   PDF (2245KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    方面级情感分析(ABSA)任务旨在判断评论语句中特定方面词的情感极性。在ABSA领域中,同时提取语法和语义这2种信息的双通道模型取得了一定的效果。然而,现有模型未能考虑语法节点间的重要程度不同、全局范围下的注意力机制引入的额外噪声以及同类特征间存在一定关联性等问题。为了解决以上问题,提出一种依赖类型及距离增强的双通道图卷积模型。首先,在语法模块引入依赖类型以衡量不同邻近节点的重要程度;其次,以依赖树距离为依据构造掩码矩阵进而过滤与语法无关的噪声;最后,引入一个有监督对比损失帮助模型学习同类特征间的关联性。实验结果表明,相较于次优模型DGNN(Dual Graph Neural Network),所提模型在SemEval-2014 Restaurant、SemEval-2014 Laptop和Twitter这3个数据集上分别取得了0.11、0.94和1.01个百分点的准确率提升,以及0.63、1.66和0.83个百分点的宏F1值提升,验证了所提模型的有效性。

    基于CNN和双向GRU混合孪生网络的语音情感识别方法
    彭鹏, 蔡子婷, 刘雯玲, 陈才华, 曾维, 黄宝来
    2025, 45(8):  2515-2521.  DOI: 10.11772/j.issn.1001-9081.2024081142
    摘要 ( )   HTML ( )   PDF (1899KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有语音情感识别(SER)模型精度较低、泛化能力较差的问题,提出一种孪生的Multi-scale CNN-BiGRU网络。该网络通过引入多尺度特征提取器(MSFE)和多维度注意力(MDA)模块构建孪生网络,并利用样本对的形式增加模型训练量,从而提高模型的识别精度,使它能更好地适应复杂的真实应用场景。在IEMOCAP和EMO-DB这2个公开数据集上的实验结果表明,所提模型在识别精确率上较CNN-BiGRU分别提升了8.28和7.79个百分点。此外,通过收集客服真实语音对话录音构建一个客服语音情感数据集,在该数据集上的实验结果表明,所提模型的识别精确率可达到87.85%,证明所提模型具有良好的泛化性。

    结合实体边界偏移的序列标注优化方法
    余婧, 陈艳平, 扈应, 黄瑞章, 秦永彬
    2025, 45(8):  2522-2529.  DOI: 10.11772/j.issn.1001-9081.2024071036
    摘要 ( )   HTML ( )   PDF (2456KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对序列标注模型在命名实体识别(NER)任务中出现的识别的实体边界与真实的实体边界之间存在位置偏差的问题,提出一种结合实体边界偏移的序列标注优化方法。首先,引入边界偏移量的概念量化每个词与实体边界之间的位置关系,计算每个词与最近实体边界的相对偏移量,再利用这些偏移量生成实体边界的候选跨度;其次,利用交并比(IoU)作为筛选标准过滤低质量的候选跨度,以保留最有可能代表实体边界的候选跨度;最后,通过边界调整模块,根据候选跨度更新标签序列中实体边界的位置,从而优化整个标签序列的实体边界,并提升实体识别的性能。实验结果表明,所提方法在数据集CLUENER2020、Resume-zh和MSRA上的F1值分别达到了80.48%、96.42%和94.80%,验证了该方法对NER任务的有效性。

    集成特征注意力和残差连接的偏标签回归算法
    吴海峰, 陶丽青, 程玉胜
    2025, 45(8):  2530-2536.  DOI: 10.11772/j.issn.1001-9081.2024071012
    摘要 ( )   HTML ( )   PDF (1384KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    偏标签回归(PLR)弥补了偏标签学习(PLL)仅聚焦于分类任务的局限。针对现有的PLR算法忽略实例特征的特性差异的问题,提出一种集成特征注意力和残差连接的偏标签回归算法(PLR-FARC)。首先,通过标签增强技术将真实数据集的标签扩充为一组实值候选标签;其次,借助注意力机制自动生成每个特征对标签的贡献度;再次,引入残差连接以减少特征在传递过程中的信息丢失,从而维持特征的完整性;最后,分别基于IDent (IDentification method)和PIDent (Progressive IDentification method)计算预测损失。在Abalone、Airfoil、Concrete、Cpu-act、Housing和Power-plant数据集上的实验结果表明,相较于IDent和PIDent,PLR-FARC的平均绝对误差(MAE)分别平均降低了2.15%、38.38%、8.86%、4.19%、15.71%和15.55%,均方误差(MSE)分别平均降低了9.35%、71.32%、23.10%、20.17%、27.22%和9.46%。可见,所提算法是可行且有效的。

    基于多尺度网络与轴向注意力的3D目标检测算法
    颜承志, 陈颖, 钟凯, 高寒
    2025, 45(8):  2537-2545.  DOI: 10.11772/j.issn.1001-9081.2024071058
    摘要 ( )   HTML ( )   PDF (2618KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在3D目标检测中小目标诸如行人和骑行者的检测精确度较低,这是自动驾驶感知系统中存在的挑战性问题。为了准确估计周围环境的状态从而提高行车安全,对Voxel R-CNN(Voxel Region-based Convolutional Neural Network)算法进行改进,提出一种基于多尺度网络与轴向注意力的3D目标检测算法。首先,在主干网络中构建多尺度网络和像素级融合模块(PFM)获取更丰富和精准的特征表示,从而增强算法在复杂场景下的鲁棒性和泛化能力;其次,设计适用于具有3D空间维度特征的轴向注意力,并将它应用于感兴趣区域(RoI)的多尺度池化特征,以在有效捕捉局部和全局特征的同时保留3D空间结构中的重要信息,从而提升算法的目标检测和分类的精度和效率;最后,将一种旋转解耦的交并比(RDIoU)方法纳入回归和分类分支,从而使网络学习更精确的边界框,并解决分类和回归之间的对齐问题。在KITTI公开数据集上的实验结果表明,所提算法对行人和骑行者的平均精度均值(mAP)分别达到了62.25%和79.36%,与基准算法Voxel R-CNN相比分别提高了4.02和3.15个百分点,显示出了改进算法在难感知目标检测上的有效性。

    自步学习指导下的半监督目标检测框架
    谢斌红, 剌颖坤, 张英俊, 张睿
    2025, 45(8):  2546-2554.  DOI: 10.11772/j.issn.1001-9081.2024081096
    摘要 ( )   HTML ( )   PDF (1517KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了提高伪标签质量并解决半监督目标检测(SSOD)中的确认偏差问题,提出一种基于动态参数的自步学习(SPL)指导下的SSOD框架。在该框架中设计动态自步参数和连续权重变量,以优化SSOD的效果。具体地,动态自步参数根据模型在训练过程中的实时表现评估样本的难易程度,而连续权重变量则通过比较样本损失与动态自步参数的关系精确评估每个样本在训练中的重要性和可靠性,并对样本中的每个物体都进行精细化权重设计。此外,该框架采用单一模型迭代训练,并引入一致性正则化策略评估模型预测的一致性。这种设计不仅能为模型提供更有针对性的权重信息,还可使模型通过权重信息的动态调整自适应地优化训练过程。在PASCAL VOC和MS-COCO数据集上的广泛对比实验结果不仅显示所提框架显著提升了模型的检测精度,还验证了所提框架良好的通用性和高效的收敛性能。特别在PASCAL VOC数据集上,所提框架相较于LabelMatch、Unbiased Teacher V2和MixTeacher在检测精度上分别提升了0.65、4.84和0.28个百分点。

    基于YOLOv9的交通路口图像的多目标检测算法
    廖炎华, 鄢元霞, 潘文林
    2025, 45(8):  2555-2565.  DOI: 10.11772/j.issn.1001-9081.2024071020
    摘要 ( )   HTML ( )   PDF (5505KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对交通路口图像复杂,小目标难测且目标之间易遮挡以及天气和光照变化引发的颜色失真、噪声和模糊等问题,提出一种基于YOLOv9(You Only Look Once version 9)的交通路口图像的多目标检测算法ITD-YOLOv9(Intersection Target Detection-YOLOv9)。首先,设计CoT-CAFRNet (Chain-of-Thought prompted Content-Aware Feature Reassembly Network)图像增强网络,以提升图像质量,并优化输入特征;其次,加入通道自适应特征融合(iCAFF)模块,以增强小目标及重叠遮挡目标的提取能力;再次,提出特征融合金字塔结构BiHS-FPN (Bi-directional High-level Screening Feature Pyramid Network),以增强多尺度特征的融合能力;最后,设计IF-MPDIoU (Inner-Focaler-Minimum Point Distance based Intersection over Union)损失函数,以通过调整变量因子,聚焦关键样本,并增强泛化能力。实验结果表明,在自制数据集和SODA10M数据集上,ITD-YOLOv9算法的检测精度分别为83.8%和56.3%,检测帧率分别为64.8 frame/s和57.4 frame/s。与YOLOv9算法相比,ITD-YOLOv9算法的检测精度分别提升了3.9和2.7个百分点。可见,所提算法有效实现了交通路口的多目标检测。

    结合预处理方法和对抗学习的公平链接预测
    彭一峰, 朱焱
    2025, 45(8):  2566-2571.  DOI: 10.11772/j.issn.1001-9081.2024081117
    摘要 ( )   HTML ( )   PDF (1218KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    链接预测是网络分析的一项重要任务,它研究个体之间的相互作用,并推断在未来不断发展的网络中可能出现的新关系;然而,在链接预测过程中可能存在偏见,特别是当涉及包含某些敏感属性的个体之间的链接时,如引发“过滤气泡”的效应,这一效应表现为在线用户公开信息的隔离程度加剧、多样性降低。针对上述问题,从算法公平性的角度缓解“过滤气泡”问题,将预处理阶段的方法和处理阶段的方法相结合,进而提出ALFLP (Adding Link and Adversarial Learning for Fair Link Prediction)方法。在预处理阶段,通过向劣势链接群组添加链接,减小不同群组的链接密度差异;在处理阶段,将预处理阶段的输出输入至基于对抗学习的方法,并通过生成器与鉴别器相互博弈,促进更多组间链接,缓解“过滤气泡”问题。在真实数据集pokec_n和pokec_z上的实验结果表明,与基线方法(如Jaccard)相比,ALFLP方法的AUC指标分别提高了约12和10个百分点,而modred指标分别提高了约0.14和0.10。可见,ALFLP方法能在公平性和预测准确性之间实现较好的权衡。

    数据科学与技术
    非冗余统计显著判别高效用模式挖掘算法
    吴军, 欧阳艾嘉, 王亚
    2025, 45(8):  2572-2581.  DOI: 10.11772/j.issn.1001-9081.2024071063
    摘要 ( )   HTML ( )   PDF (1526KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对高效用模式挖掘任务中假阳性模式和冗余模式的判别问题,提出一种基于无限制检验和独立成长率的判别高效用模式挖掘算法UTDHU(Unlimited Testing for Discriminative High Utility pattern mining)。首先,找到目标事务集合中满足效用阈值和差异阈值的判别高效用模式;其次,建立前缀项共享树以快速计算每个模式的独立成长率,并基于独立成长率筛除未超过独立阈值的冗余判别高效用模式;最后,使用无限制检验计算余下每个模式的统计显著性度量p值,并根据错误率判断族过滤整体结果中的假阳性判别高效用模式。在4个基准事务集合和2个仿真事务集合上的实验结果表明,相较于Hamm和YBHU (Yekutieli-Benjamini resampling for High Utility pattern mining)等算法,所提算法在模式数量方面输出最少,过滤了至少97.8%的被检验模式;在模式质量方面,所提算法的假阳性判别高效用模式占比低于5.2%,且构造特征的分类准确率高于对比算法至少1.5个百分点;虽然所提算法在运行时间方面慢于Hamm算法,但快于其余3个基于统计显著性检验的算法。可见,所提算法能够有效剔除一定数量的假阳性和冗余判别高效用模式,在挖掘性能上更优,且运行效率更高。

    基于扩散模型的增量式时间序列缺失值填充算法
    冯兴杰, 卞兴鹏, 冯小荣, 王兴隆
    2025, 45(8):  2582-2591.  DOI: 10.11772/j.issn.1001-9081.2024071046
    摘要 ( )   HTML ( )   PDF (3896KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    时间序列中的数据缺失是一个普遍存在的问题,这会给后续分析带来困难,对缺失值的有效填充是提升数据质量以及挖掘数据价值的重要着力点。然而,现有的填充算法在特征提取方面多沿用时序预测任务的面向非缺失数据的注意力模块,而对含有缺失值的时间序列的时空特征提取效果欠佳。此外,现有的填充算法缺乏对填充规律的深入研究,这让它们对于填充过程中的阶段性填充值利用不足,导致填充的准确率有待进一步提升。为了解决上述问题,提出一种基于扩散模型的增量式时间序列缺失值填充算法(I2TDM)。I2TDM在经典扩散模型中融入时序注意力模块,以增强对于含有缺失值的时间序列的特征提取能力。同时,设计一个新颖的增量式填充算法,使用增量选择模块保留部分阶段性填充值,从而提升填充算法的稳定性与准确率。在空气质量指数(AQI)、电力变压器油温(ETT)和天气(Weather)3个公开数据集上的填充实验结果表明,I2TDM相较于CSDI、SAITS和PriSTI等基线模型在平均绝对误差(MAE)指标上至少降低了2.92%,在均方根误差(RMSE)指标上至少降低了3.49%。可见,I2TDM能够有效提升时间序列缺失值填充的准确率。

    基于项图动态适应性生成的多任务社交项推荐方法
    王义, 马应龙
    2025, 45(8):  2592-2599.  DOI: 10.11772/j.issn.1001-9081.2024071038
    摘要 ( )   HTML ( )   PDF (2217KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    除了考虑用户间的社交关系,挖掘项间隐含的关系特征对提升用户和项的表示学习能力同样具有至关重要的作用。当前社交项推荐中静态项图构建过程难以准确抓取项间的潜在关系,且后续的图融合过程缺乏深度交互,这限制了相关模型对多图特征间复杂且多层次关系的理解能力。因此,提出一种基于项图动态适应性生成的多任务社交项推荐方法(MTDAG)。首先,在基于多任务学习(MTL)的联合训练中,使用项图动态生成模块结合下游推荐任务的反馈信息适应性地调整项图结构;其次,使用社交项推荐模块通过深层次的多图特征融合方法在各输入图之间迭代地传播用户和项的特征表示;最后,在Yelp和Ciao两个公共数据集上把MTDAG与ECGN (Efficient Complementary Graph convolutional Network)和MGL (Meta Graph Learning framework)等6种基线方法比较。实验结果表明,MTDAG在命中率(HR)、召回率(Recall)和归一化折损累计增益(NDCG)上均至少提高了3%且MTDAG的鲁棒性在针对冷用户和冷项推荐的评估实验中得到了充分验证,实验结果表明,MTDAG可以在一定程度上解决交互稀疏的冷用户和冷项的推荐问题。

    网络空间安全
    安全高效的混洗差分隐私频率估计方法
    晏燕, 李飞飞, 吕雅琴, 冯涛
    2025, 45(8):  2600-2611.  DOI: 10.11772/j.issn.1001-9081.2024070911
    摘要 ( )   HTML ( )   PDF (3001KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    混洗差分隐私(SDP)模型能兼顾用户端的隐私保护程度和服务器端发布结果的可用性,更适用于隐私保护的大数据收集和统计发布场景。针对目前SDP频率估计方法的洗牌效率较低和混洗过程安全性不足等问题,进行以下工作:首先,设计基于优化椭圆曲线的混洗差分隐私盲签名算法(SDPBSA),以实现对篡改或伪造信息的鉴别,提高混洗过程的安全性;其次,提出矩阵列重排转置(MCRT)洗牌方法,以利用随机的矩阵列重排和矩阵转置操作实现数据混洗,提高混洗过程的效率;最后,结合上述方法构建完整的SDP频率估计隐私保护框架——SM-SDP (SDP based on blind Signature and Matrix column rearrangement transposition),并通过理论分析讨论它的隐私性和误差级别。在Normal、Zipf和IPUMS (Integrated Public Use Microdata Series)等数据集上的实验结果表明,相较于Fisher-Yates、ORShuffle (Oblivious Recursive Shuffling)和MRS (Message Random Shuffling)等洗牌方法, MCRT洗牌方法的洗牌效率提升了1~2个数量级;相较于mixDUMP、PSDP (Personalized Differential Privacy in Shuffle model)和HP-SDP (Histogram Publication with SDP)等频率估计方法, SM-SDP框架在不同比例恶意数据存在时的均方误差(MSE)降低了2~11个数量级。

    基于穿刺伪随机函数的动态可搜索加密方案
    刘运东, 汪学明
    2025, 45(8):  2612-2621.  DOI: 10.11772/j.issn.1001-9081.2024071011
    摘要 ( )   HTML ( )   PDF (1426KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    动态可搜索加密由于在云服务器上提供添加、删除与搜索数据的功能而受到广泛关注。现有的动态可搜索加密方案通常须由较高安全性的密码学原语构造,在方案搜索时需要进行多次双线性对运算。针对动态可搜索加密方案在服务器中搜索时较大的计算开销,将穿刺伪随机函数(PPRF)引入动态可搜索加密中,设计并提出一种基于PPRF的动态可搜索加密方案。该方案不必使用对称加密算法来加密文件标识符,同时也不必在服务器搜索时解密密文获取文件标识符,而客户端与服务器仅需一次交互即能完成数据搜索。而且,该方案在删除关键字时标记密钥,在搜索时使用标记密钥计算PPRF,并使用前向安全方案实现后向安全,在保证安全性的同时提高搜索效率。根据动态可搜索加密方案的安全模型,证明了该方案的安全性。仿真实验结果表明,与基于密钥可更新伪随机函数(KUPRF)构建的方案ROSE、基于对称穿刺加密(SPE)构建的方案Janus++和基于对称可撤销加密(SRE)构建的方案Aura相比,所提方案的每个关键字的平均搜索时间分别降低了17%、65%和58%。可见,所提方案有效且可行,有效地降低了服务器的搜索成本,提高了方案的搜索效率,增强了方案实用性。

    智能车载网联系统中匿名可追踪的认证密钥协商协议
    张晓均, 王周阳, 李磊, 唐浩宇, 薛婧婷, 张新鹏
    2025, 45(8):  2622-2629.  DOI: 10.11772/j.issn.1001-9081.2024081137
    摘要 ( )   HTML ( )   PDF (1345KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    智能车载网联系统是现代城市智能交通系统的核心组成部分,对于交通信息共享与安全管理至关重要。隐私保护认证是维护智能车载网联系统安全的主要手段,其中保护身份隐私以及追踪恶意节点尤为重要。现有的协议大多以匿名身份保护用户隐私,然而这些方案并未追踪匿名身份,存在恶意用户通过伪造或篡改匿名身份信息逃避交通事故追责的情况。为了解决这些安全威胁,面向智能车载网联系统,设计一种智能车载网联系统中基于椭圆曲线的高效匿名可追踪的认证密钥协商协议。具体地,当路侧的基站单元收到认证请求后,会对智能车辆签名及匿名身份进行安全验证,最终实现密钥协商的双向认证,智能车辆将保持匿名认证权限直到被智能车载网联系统撤销。该协议基于椭圆曲线的身份密码系统进行设计,从而避免计算开销较高的密码学双线性对映射操作。实验结果表明,相较于基于公钥基础设施(PKI)认证协议、基于伪身份和哈希消息认证码(HMAC)的协议、基于物理不可克隆函数(PUF)的协议、分布式智能车载网联系统协议和基于双线性对映射的协议,所提协议的通信开销最低,而所提协议的计算开销与对比协议中最低的分布式智能车载网联系统协议基本持平。安全性分析与性能评估表明,所提协议在智能车载网联系统能保护用户隐私,在匿名认证过程具备高效的计算性能,因此能够有效部署在智能交通系统中。

    区块链边缘节点安全架构P-Dledger
    王迪
    2025, 45(8):  2630-2636.  DOI: 10.11772/j.issn.1001-9081.2024111579
    摘要 ( )   HTML ( )   PDF (3808KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对区块链边缘节点的部署环境开放、安全措施薄弱、易受到安全攻击,以及计算和网络资源不足等问题,提出一种基于可信执行环境(TEE)的区块链安全架构P-Dledger。该架构通过构建两阶段的信任链,在满足软件便捷迭代的基础上,确保加载部件的可信;通过实现智能合约可信执行框架以及基于串行外设接口或非门存储器(SPI NOR Flash)的数据可信存储,保证智能合约的可信计算与数据的可信存储;同时,为共识提案赋予单调递增的唯一标识,限制拜占庭节点的行为。实验与分析结果表明:所提架构确保了加载主体、账本数据与执行过程的安全可信;当网络延时大于60 ms或节点数大于8时,P-Dledger比采用拜占庭容错(PBFT)算法的区块链系统的吞吐量更高,且随着网络延时与节点数的增加,P-Dledger性能表现更稳定。

    先进计算
    R22FFT算法的FPGA硬件结构优化设计与实现
    肖海林, 杨昱东, 杨紫伊, 刘海龙, 王玉, 张中山, 戴晓明
    2025, 45(8):  2637-2645.  DOI: 10.11772/j.issn.1001-9081.2024071010
    摘要 ( )   HTML ( )   PDF (3291KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对快速傅里叶变换(FFT)算法处理大规模数据时因消耗大量资源和时间而导致运算速度慢的问题,提出一种基22快速傅里叶变换(R22FFT)算法的现场可编程门阵列(FPGA)硬件结构优化设计与实现方法。首先,采用R22FFT算法构建一种序列转换功能与流水线结构相结合的Y形双并行阵列结构,在有效降低硬件乘法器使用数量的同时,增大硬件结构的吞吐量,提高FFT算法在FPGA上的运算速度;其次,通过在R22FFT流水线的单级运算中利用旋转因子的相关特性,优化片上存储的资源消耗,使存储空间降低约50.00%;最后,在完成N点R22FFT算法结构优化的基础上,进一步提高硬件结构的可扩展性,即实现2N点和4N点的扩展运算。采用Verilog HDL语言完成硬件设计,并通过Modelsim仿真,使用Vivado2018.3软件将所提方法综合并布局布线,并分析所提方法的性能。实验结果表明,与4种改进的FFT硬件实现方法的运算时间相比,所提方法的运算时间分别降低了75.10%、95.34%、38.49%和49.20%,可见所提方法显著提高了运算速度。同时,所提方法资源消耗适中,消耗占比低,且具有运行功耗低以及可扩展性强的特点。

    基于多层感知机-注意力模型的功耗预测算法
    敬超, 全育涛, 陈艳
    2025, 45(8):  2646-2655.  DOI: 10.11772/j.issn.1001-9081.2024081092
    摘要 ( )   HTML ( )   PDF (3117KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    虽然异构计算系统的应用可以加快神经网络参数的处理,但系统功耗也随之剧增。良好的功耗预测方法是异构系统优化功耗和处理多类型工作负载的基础,基于此,通过改进多层感知机-注意力模型,提出一种面向CPU/GPU异构计算系统多类型工作负载的功耗预测算法。首先,考虑服务器功耗与系统特征,建立一种基于特征的工作负载功耗模型;其次,针对现有的功耗预测算法不能解决系统特征与系统功耗之间的长程依赖的问题,提出一种改进的基于多层感知机-注意力模型的功耗预测算法Prophet,该算法改进多层感知机实现各个时刻的系统特征的提取,并使用注意力机制综合这些特征,从而有效解决系统特征与系统功耗之间的长程依赖问题;最后,在实际系统中开展相关实验,将所提算法分别与MLSTM_PM (Power consumption Model based on Multi-layer Long Short-Term Memory)和ENN_PM (Power consumption Model based on Elman Neural Network)等功耗预测算法对比。实验结果表明,Prophet具有较高的预测精准性,与MLSTM_PM算法相比,在工作负载blk、memtest和busspd上将平均相对误差(MRE)分别降低了1.22、1.01和0.93个百分点,并且具有较低的复杂度,表明了所提算法的有效性及可行性。

    面向复杂约束多目标优化问题的双种群双阶段进化算法
    袁志超, 杨磊, 田井林, 魏晓威, 李康顺
    2025, 45(8):  2656-2665.  DOI: 10.11772/j.issn.1001-9081.2024081130
    摘要 ( )   HTML ( )   PDF (2608KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对包含复杂约束条件的约束多目标优化问题(CMOP),在确保算法满足严格约束的同时,有效平衡算法的收敛性与多样性是重大挑战。因此,提出一种双种群双阶段的进化算法(DPDSEA)。该算法引入2个独立进化种群:主种群和副种群,并分别利用可行性规则和改进的epsilon约束处理方法进行更新。在第一阶段,主种群和副种群分别探索约束Pareto前沿(CPF)与无约束Pareto前沿(UPF),从而获取UPF和CPF的位置信息;在第二阶段,设计一种分类方法,根据UPF与CPF的位置对CMOP进行分类,从而对不同类型的CMOP执行特定的进化策略;此外,提出一种随机扰动策略,在副种群进化到CPF附近时,对它进行随机扰动以产生一些位于CPF上的个体,从而促进主种群在CPF上的收敛与分布。把所提算法与6个具有代表性的算法:CMOES (Constrained Multi-objective Optimization based on Even Search)、dp-ACS (dual-population evolutionary algorithm based on Adaptive Constraint Strength)、c-DPEA (Dual-Population based Evolutionary Algorithm for constrained multi-objective optimization)、CAEAD (Constrained Evolutionary Algorithm based on Alternative Evolution and Degeneration)、BiCo (evolutionary algorithm with Bidirectional Coevolution)和DDCMOEA (Dual-stage Dual-population Evolutionary Algorithm for Constrained Multiobjective Optimization)在LIRCMOP和DASCMOP两个测试集上进行实验比较。实验结果表明,DPDSEA在23个问题中取得了15个最优反转世代距离(IGD)值和12个最优超体积(HV)值,展现了DPDSEA在处理复杂CMOP时显著的性能优势。

    基于等变图神经网络的拉格朗日粒子流模拟
    蒋权, 黄文清, 苟志勇
    2025, 45(8):  2666-2671.  DOI: 10.11772/j.issn.1001-9081.2024111601
    摘要 ( )   HTML ( )   PDF (2667KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    图神经网络(GNN)因能较好解决结构网格的问题,且有较强的组合泛化能力,被越来越多地应用于复杂的流体系统预测。然而,在拉格朗日无网格视角下,经过平移、旋转或翻转变换的流体粒子信息输入GNN会出现不可预测的输出问题。为了解决该问题,提出基于等变图神经网络模拟(EGNS)的方法。首先,将几何向量转换为相对的等变量;其次,通过每一步具有等变性的消息传递使整个神经网络具有等变性,网络输出与输入等变量的空间变换保持一致;最后,在光滑粒子流体动力学(SPH)方法模拟的粒子轨迹里训练得到较优的EGNS模型。在公开流体仿真数据集上的实验结果表明,EGNS具有良好预测效果,相较于图神经网络模拟(GNS)的方法,EGNS在流体粒子运动形态、速度及典型细节的表现力上更准确,预测粒子的位置均方误差(MSE)减小了约16%。

    网络与通信
    复杂电磁环境下的调制识别网络
    周金, 李玉芝, 张徐, 高硕, 张立, 盛家川
    2025, 45(8):  2672-2682.  DOI: 10.11772/j.issn.1001-9081.2025010117
    摘要 ( )   HTML ( )   PDF (5665KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    自动调制识别(AMR)是无线通信系统的关键技术。针对AMR网络在复杂电磁环境下迁移能力较差以及对噪声和调制信号的特征区分能力不足的问题,提出去噪及双模态注意力Transformer及卷积融合网络(Denoising & Dual-modal Attention CNN-Transformer, D-DmACT)。首先,设计一种迭代生成复杂干扰的生成器和对抗干扰的判别器,增强模型在遭遇复杂电磁环境时的泛化能力;其次,设计基于复数注意力的Transformer模块,以捕获同相正交(IQ)信号的时域特征,并设计基于时频位置信息的坐标注意力模块,以获取时频图像的特征,并对两种特征进行交叉融合;再次,将判别器输出的时序复序列和时频图像送至双模态注意力融合模型;最后,实现轻量化的分类识别。在数据集RadioML2016.10a和RadioML2018.01a上分别开展的高斯白噪声以及复杂电磁环境下的识别实验的结果表明:在脉冲噪声的作用下,相较于CLDNN(Convolutional Long short-term Deep Neural Network)、残差网络(ResNet)和长短期记忆(LSTM)网络,所提网络的平均识别准确率分别提高了53.98%、28.82%和24.64%,而相较于多模态自动调制分类网络(MM-Net)、阈值自编码去噪卷积神经网络(TADCNN)和生成式对抗网络联合多模态注意力机制卷积长短期记忆网络(GAN-MnACL),所提网络的平均识别准确率分别提高了19.74%、13.55%和11.17%。在计算复杂度方面,通过参数量和浮点运算数(FLOPs)等指标验证了所提网络在终端的可部署性。

    计算机软件技术
    数字孪生系统开发运维一体化方法DTOps
    苗荣华, 孙奕程, 王森, 武燕婷, 杜明, 鲍劲松
    2025, 45(8):  2683-2693.  DOI: 10.11772/j.issn.1001-9081.2024071051
    摘要 ( )   HTML ( )   PDF (6775KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了缩短数字孪生(DT)系统迭代和维护的时间,并降低DT系统的演进成本,探索将开发运维一体化(DevOps)方法论融入DT系统的潜力,并提出一种创新的DT系统DevOps(DTOps)实践。针对DT系统的特定需求和特性,设计面向服务的系统架构,提升系统的可扩展性与敏捷性,并给出DTOps的主要基础设施和持续集成(CI)以及持续交付(CD)的实现方法。在齿轮生产线的案例研究中,采用开源技术工具验证DTOps的各个环节,展示DTOps实现的可行性与便捷性。实验研究结果表明,DTOps相较于单体架构和微服务架构,演进效率分别提升了29.7%和26.9%,尤其在高度集成和数据密集的环境中效果显著,验证了DTOps在工程应用中的有效性。

    多媒体计算与计算机仿真
    飞机狭小空间虚拟维修姿态分层求解方法
    刘哲旭, 张澳冰, 樊智勇
    2025, 45(8):  2694-2703.  DOI: 10.11772/j.issn.1001-9081.2024071068
    摘要 ( )   HTML ( )   PDF (4570KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    维修性虚拟仿真是飞机结构及系统设计的重要工具,其中快速生成合适的虚拟人维修姿态对维修性分析的效率和可行性至关重要。针对目前虚拟人维修姿态求解方法效率较低且适用性有限的问题,提出一种飞机狭小空间虚拟维修姿态分层求解方法。该方法以腰部为分界点,将维修姿态分解为上身和下身两部分,利用带精英策略的非支配排序遗传算法(NSGA-Ⅱ)分别对它们优化求解获取整体维修姿态。首先,综合考虑空间限制和人体结构约束后,构建维修姿态优化准则;其次,依据维修姿态优化准则,通过解析几何和逆向运动学原理,构建上身和下身姿态的多目标优化模型,并运用NSGA-Ⅱ对它们依次求解。通过对飞机驾驶舱大气数据模块(ADM)拆卸和货舱内货物推行案例的分析,验证了所提方法能在飞机狭小空间里高效生成虚拟维修姿态,且具有良好的适用性和可行性。

    基于容器的规模化无人机集群仿真引擎研究与实现
    汤恒先, 姚远, 康浩翔
    2025, 45(8):  2704-2711.  DOI: 10.11772/j.issn.1001-9081.2024081090
    摘要 ( )   HTML ( )   PDF (3780KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    仿真引擎是仿真平台运行的关键。针对现有无人机(UAV)仿真平台并行度较低、计算资源不足且难以扩展的问题,采用分布式的仿真框架及容器机制,设计并实现UAV集群容器化并行仿真引擎(USCPSE)。所提仿真引擎使用容器作为UAV虚拟实体的运行载体,并将容器部署至并行的多个仿真节点,以实现规模化UAV集群仿真。此外,基于容器热迁移技术,提出通信和计算负载融合的容器调度策略。该策略可以根据集群间的通信关系以及仿真节点计算负载的变化,动态迁移容器,从而有效提升规模化UAV集群仿真的综合性能。实验结果表明,在100、150和200节点的集群规模下,USCPSE与基于MPI的并行仿真架构相比,仿真加速比分别提升了22.4%、59.8%和101.9%,同时通信量平均降低了51.8%。

    基于跨尺度注意力网络的胸部疾病分类方法
    林进浩, 罗川, 李天瑞, 陈红梅
    2025, 45(8):  2712-2719.  DOI: 10.11772/j.issn.1001-9081.2024071019
    摘要 ( )   HTML ( )   PDF (1831KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    从胸部X光片中自动识别胸部疾病是计算机辅助诊断的重要研究领域。然而,现有的许多胸部疾病分类方法在处理病变区域大小差异方面存在困难,并且无法准确识别和定位不同疾病的病变区域。针对上述问题,提出一种基于跨尺度注意力网络(CANet)的胸部疾病分类方法。该方法使用DenseNet-121作为特征提取网络,并集成自感知注意力(SAA)、向上聚焦注意力(UFA)和向下引导注意力(DGA)3个主要模块。SAA模块通过提取与胸部疾病相关的通道和异常区域信息,细化空间位置上的病理特征,并减少不相关区域的干扰。为了实现不同尺度空间上下文信息的跨尺度交互,使用UFA和DGA模块进行图像特征校准。此外,提出空间注意力金字塔池化(SAPP)模块用于融合不同特征图的多尺度特征,从而提高胸部疾病的检测性能。在ChestX-ray14和DR-Pneumonia数据集上的实验结果表明,所提方法的平均曲线下面积(AUC)值分别达到了83.4%和82.6%,优于DualCheXNet、A3Net和CheXGAT等方法。具体地,与CheXGAT方法相比,所提方法的平均AUC值分别提高了0.7和0.1个百分点。可见,所提方法可以识别胸部X光片中的重要信息,有效提高了胸部疾病分类的性能。

    基于空间变换网络和特征分布校准的小样本皮肤图像分类模型
    王静, 刘嘉星, 宋婉莹, 薛嘉兴, 丁温欣
    2025, 45(8):  2720-2726.  DOI: 10.11772/j.issn.1001-9081.2024071039
    摘要 ( )   HTML ( )   PDF (1746KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于深度学习的图像分类模型通常需要大量标记数据,然而,在医学领域的皮肤病变分类任务中,收集大量图像数据面临着诸多挑战。为了能准确分类小样本皮肤疾病,提出一种基于空间变换网络(STN)和特征分布校准的小样本分类模型。首先,将迁移学习和元学习相结合,以解决跨域迁移小样本存在的过拟合问题;其次,在预训练分类任务前插入旋转角度预测任务,以便模型更好地适应医学图像数据的高复杂度;再次,在对图像下采样后引入STN,以通过显式地对输入图像进行仿射变换,增强特征的提取和识别能力;最后,通过特征分布校准对新类特征进行约束,并引入最邻近质心算法进行分类决策,在简化算法流程的同时显著提升分类精度。在ISIC2018皮肤病变数据集上的实验结果表明,与当前主流小样本模型Meta-Baseline相比,在2-way和3-way分类任务中,所提模型的平均精度分别提高了11.80和10.82个百分点;与模型MetaMed相比,在2-way 3-shot和3-way 3-shot分类任务中,所提模型的分类精度分别提升了6.65和9.58个百分点。可见,所提模型有效提高了小样本皮肤疾病的分类精度,能够更好地辅助医生提高临床诊断精确度。

2025年 45卷 7期
刊出日期: 2025-07-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会