当期目录

    2024年 第44卷 第6期 刊出日期:2024-06-10
    CCF第38届中国计算机应用大会 (CCF NCCA 2023)
    大语言模型的技术应用前景与风险挑战
    徐月梅, 胡玲, 赵佳艺, 杜宛泽, 王文清
    2024, 44(6):  1655-1662.  DOI: 10.11772/j.issn.1001-9081.2023060885
    摘要 ( )   HTML ( )   PDF (1142KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-Trained Transformer)等语言模型为代表,综述LLM的发展脉络、核心技术和评估体系;其次,分析LLM现存的技术局限和安全风险;最后,提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM,现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺,算力需求庞大,对数据质量和数量依赖性强,语言风格单一;存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进,从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”;从政策上实时跟进,实施有针对性的监管措施,规范应用和发展。

    联邦学习中的安全威胁与防御措施综述
    陈学斌, 任志强, 张宏扬
    2024, 44(6):  1663-1672.  DOI: 10.11772/j.issn.1001-9081.2023060832
    摘要 ( )   HTML ( )   PDF (1072KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    联邦学习是一种用于解决机器学习中数据共享问题和隐私保护问题的分布式学习方法,旨在多方共同训练一个机器学习模型并保护数据的隐私;但是,联邦学习本身存在安全威胁,这使得联邦学习在实际应用中面临巨大的挑战,因此,分析联邦学习面临的攻击和相应的防御措施对联邦学习的发展和应用至关重要。首先,介绍联邦学习的定义、流程和分类,联邦学习中的攻击者模型;其次,从联邦学习系统的鲁棒性和隐私性两方面介绍可能遭受的攻击,并介绍不同攻击相应的防御措施,同时也指出防御方案的不足;最后,展望安全的联邦学习系统。

    不完整多视图聚类综述
    董瑶, 付怡雪, 董永峰, 史进, 陈晨
    2024, 44(6):  1673-1682.  DOI: 10.11772/j.issn.1001-9081.2023060813
    摘要 ( )   HTML ( )   PDF (2050KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    多视图聚类是近年来图数据挖掘领域的研究热点。由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此,综合研究不完整多视图聚类(IMC)近年的发展具有重要的理论意义和实践价值。首先,归纳分析不完整多视图数据缺失类型;其次,详细比较基于多核学习(MKL)、矩阵分解(MF)学习、深度学习和图学习这4类IMC方法,分析代表性方法的技术特点和区别;再次,从数据集类型、视图和类别数量、应用领域等角度总结22个公开不完整多视图数据集;继次,总结评价指标,并系统分析现有不完整多视图聚类方法在同构和异构数据集上的性能表现;最后,归纳分析不完整多视图聚类目前存在的问题、未来的发展方向和现有应用领域。

    在线教育学习者知识追踪综述
    赵雅娟, 孟繁军, 徐行健
    2024, 44(6):  1683-1698.  DOI: 10.11772/j.issn.1001-9081.2023060852
    摘要 ( )   HTML ( )   PDF (2932KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    知识追踪(KT)是在线教育中一项基础且具有挑战性的任务,同时也是从学习者的学习历史中建立学习者知识状态模型的任务,可以帮助学习者更好地了解自己的知识状态,使教育者更好地了解学习者的学习情况。对在线教育学习者KT研究进行综述。首先,介绍KT的主要任务和发展历程;其次,从传统KT模型和深度学习KT模型两个方面展开叙述;再次,归纳总结相关数据集和评价指标,并汇总KT的相关应用;最后,总结KT现状,讨论它们的不足和未来发展方向。

    基于业务流程的认知图谱
    刘耀, 李雨萌, 宋苗苗
    2024, 44(6):  1699-1705.  DOI: 10.11772/j.issn.1001-9081.2023060850
    摘要 ( )   HTML ( )   PDF (988KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目前软件项目开发过程中无法充分利用已有业务资源,进而导致开发效率低、能力弱等问题,通过研究业务资源之间的关联,提出一种基于业务流程的认知图谱。首先,通过正式文档抽取业务知识,提出建立知识层级的方法并修正;其次,通过代码特征挖掘与代码实体相似度判断构建代码网络表示模型;最后,利用实际业务数据进行实验验证,并与向量空间模型(VSM)、多样化排序和深度学习等方法进行对比。最终构建的基于业务流程的认知图谱在代码检索方面优于目前基于文本匹配的方法和深度学习算法,分别在前5准确率(precision@5)、平均精度均值(mAP)、归一化折扣增益值(?-NDCG)这3项指标上高过多样化排序的代码检索方法4.30、0.38和2.74个百分点,有效解决了潜在业务词汇识别、业务认知推理表示等多个问题,提升了代码检索效果与业务资源利用率。

    融合多粒度语言知识与层级信息的中文命名实体识别模型
    于右任, 张仰森, 蒋玉茹, 黄改娟
    2024, 44(6):  1706-1712.  DOI: 10.11772/j.issn.1001-9081.2023060833
    摘要 ( )   HTML ( )   PDF (1485KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对当前大多数命名实体识别(NER)模型只使用字符级信息编码且缺乏对文本层次信息提取的问题,提出一种融合多粒度语言知识与层级信息的中文NER(CNER)模型(CMH)。首先,使用经过多粒度语言知识预训练的模型编码文本,使模型能够同时捕获文本的细粒度和粗粒度语言信息,从而更好地表征语料;其次,使用ON-LSTM(Ordered Neurons Long Short-Term Memory network)模型提取层级信息,利用文本本身的层级结构信息增强编码间的时序关系;最后,在模型的解码端结合文本的分词信息,并将实体识别问题转化为表格填充问题,以更好地解决实体重叠问题并获得更准确的实体识别结果。同时,为解决当前模型在不同领域中的迁移能力较差的问题,提出通用实体识别的理念,通过筛选多领域的通用实体类型,构建一套提升模型在多领域中的泛化能力的通用NER数据集MDNER(Multi-Domain NER dataset)。为验证所提模型的效果,在数据集Resume、Weibo、MSRA上进行实验,与MECT(Multi-metadata Embedding based Cross-Transformer)模型相比,F1值分别提高了0.94、4.95和1.58个百分点。为了验证所提模型在多领域中的实体识别效果,在MDNER上进行实验,F1值达到了95.29%。实验结果表明,多粒度语言知识预训练、文本层级结构信息提取和高效指针解码器对模型的性能提升至关重要。

    基于掩码提示与门控记忆网络校准的关系抽取方法
    魏超, 陈艳平, 王凯, 秦永彬, 黄瑞章
    2024, 44(6):  1713-1719.  DOI: 10.11772/j.issn.1001-9081.2023060818
    摘要 ( )   HTML ( )   PDF (1155KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对关系抽取(RE)任务中实体关系语义挖掘困难和预测关系有偏差等问题,提出一种基于掩码提示与门控记忆网络校准(MGMNC)的RE方法。首先,利用提示中的掩码学习实体之间在预训练语言模型(PLM)语义空间中的潜在语义,通过构造掩码注意力权重矩阵,将离散的掩码语义空间相互关联;其次,采用门控校准网络将含有实体和关系语义的掩码表示融入句子的全局语义;再次,将它们作为关系提示校准关系信息,随后将句子表示的最终表示映射至相应的关系类别;最后,通过更好地利用提示中掩码,并结合传统微调方法的学习句子全局语义的优势,充分激发PLM的潜力。实验结果表明,所提方法在SemEval(SemEval-2010 Task 8)数据集的F1值达到91.4%,相较于RELA(Relation Extraction with Label Augmentation)生成式方法提高了1.0个百分点;在SciERC(Entities, Relations, and Coreference for Scientific knowledge graph construction)和CLTC(Chinese Literature Text Corpus)数据集上的F1值分别达到91.0%和82.8%。所提方法在上述3个数据集上均明显优于对比方法,验证了所提方法的有效性。相较于基于生成式的方法,所提方法实现了更优的抽取性能。

    基于改进TextRank的科技文本关键词抽取方法
    杨冬菊, 胡成富
    2024, 44(6):  1720-1726.  DOI: 10.11772/j.issn.1001-9081.2023060845
    摘要 ( )   HTML ( )   PDF (1171KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过迭代计算得到词语的初始得分;然后,利用K-Core(K-Core decomposition)算法挖掘K-Core子图得到词语的层级特征,利用平均信息熵特征衡量词语的主题表征能力;最后,在词语初始得分的基础上融合层级特征和平均信息熵特征,从而确定关键词。实验结果表明,在公开数据集上,与TextRank方法和OTextRank(Optimized TextRank)方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了6.5和3.3个百分点;在科技服务项目数据集上,与TextRank方法和OTextRank方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了7.4和3.2个百分点。实验结果验证了所提方法抽取出现频率低但较好表达文本主旨关键词的有效性。

    基于大数据随机样本划分的分布式观测点分类器
    李旭, 何玉林, 崔来中, 黄哲学, PHILIPPE Fournier‑Viger
    2024, 44(6):  1727-1733.  DOI: 10.11772/j.issn.1001-9081.2023060847
    摘要 ( )   HTML ( )   PDF (2503KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    观测点分类器(OPC)是一种试图通过将多维样本空间线性不可分问题转换成一维距离空间线性可分问题的有监督学习模型,对高维数据的分类问题尤为有效。针对OPC在处理大数据分类问题时表现的较高训练复杂度,在Spark框架下设计一款基于大数据的随机样本划分(RSP)的分布式OPC(DOPC)。首先,在分布式计算环境下生成大数据的RSP数据块,并将它转换为弹性分布式数据集(RDD);其次,在RSP数据块上协同式地训练一组OPC,由于每个RSP数据块上的OPC独立训练,因此有高效的Spark可实现性;最后,在Spark框架下将在RSP数据块上协同训练的OPC集成为DOPC,对新样本进行类标签预测。在8个大数据集上,对Spark集群环境下实现的DOPC的可行性、合理性和有效性进行实验验证,实验结果显示,DOPC能够以更低的计算消耗获得比单机OPC更高的测试精度,同时相较于Spark框架下实现的基于RSP模型的神经网络(NN)、决策树(DT)、朴素贝叶斯(NB)和K最近邻(KNN),DOPC分类器具有更强的泛化性能。测试结果表明,DOPC是一种高效低耗的处理大数据分类问题的有监督学习算法

    基于事件表示和对比学习的深度事件聚类方法
    蒋小霞, 黄瑞章, 白瑞娜, 任丽娜, 陈艳平
    2024, 44(6):  1734-1742.  DOI: 10.11772/j.issn.1001-9081.2023060851
    摘要 ( )   HTML ( )   PDF (5604KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有深度聚类方法不考虑事件信息及其结构特点而难以有效划分事件类型的问题,提出一种基于事件表示和对比学习的深度事件聚类方法(DEC_ERCL)。首先,利用信息识别手段从非结构化文本中识别结构化的事件信息,避免冗余信息对事件语义的影响;其次,将事件的结构信息集成于自编码器中学习低维稠密的事件表示,并以此作为下游聚类划分的依据;最后,为有效建模事件之间的细微差异,在特征学习过程中加入多正例对比损失。在数据集DuEE、FewFC、Military和ACE2005上的实验结果表明,相较于其他深度聚类方法,所提方法在准确率和标准化互信息(NMI)评价指标上均表现更好;相较于次优的方法,DEC_ERCL的聚类准确率分别提升了17.85%、9.26%、7.36%和33.54%,表明了DEC_ERCL具有更好的事件聚类效果。

    工业多元时序数据质量评估方法
    宋洪涛, 于江生, 韩启龙
    2024, 44(6):  1743-1750.  DOI: 10.11772/j.issn.1001-9081.2023060824
    摘要 ( )   HTML ( )   PDF (789KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的数据质量评估(DQA)方法通常只从特定数据质量维度(DQD)的基本概念分析,忽略了能够反映数据质量(DQ)关键信息的细粒度的子维度对评估结果的影响。针对上述问题,提出一种工业多元时序数据质量评估(IMTSDQA)方法。首先,对于待评估的DQD,如完整性、规范性、一致性、唯一性和准确性等进行细粒度划分,考虑同一DQD内或不同DQD间各子维度的相关性以确定这些子维度的度量;其次,对完整性的属性完整性、记录完整性、数值完整性,规范性的类型规范性、精度规范性,一致性的顺序一致性、逻辑一致性,唯一性的属性唯一性、记录唯一性,准确性的范围准确性、数值准确性等子维度进行权重分配,进而充分挖掘DQD的深层次信息,从而获得反映DQ详情的评估结果。实验结果表明,与现有的基于框架定性分析、依据DQD基本定义构建模型的方法相比,IMTSDQA能更详细、更全面地评估DQ,且不同DQD的评估结果更能客观准确地反映DQ问题。

    人工智能
    基于不确定知识图谱嵌入的多关系近似推理模型
    李健京, 李贯峰, 秦飞舟, 李卫军
    2024, 44(6):  1751-1759.  DOI: 10.11772/j.issn.1001-9081.2023060762
    摘要 ( )   HTML ( )   PDF (1027KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对大规模知识图谱(KG)的不确定性嵌入模型中无法对多种逻辑关系进行近似推理的问题,提出一种基于不确定KG嵌入(UKGE)的多关系近似推理模型UDConEx(Uncertainty DistMult (Distance Multiplicative) and complex Convolution Embedding)。首先,UDConEx结合DistMult和ComplEx(Complex Embedding)模型的特点,使得UDConEx具有推理对称与非对称关系的能力;其次,UDConEx采用卷积神经网络(CNN)捕获不确定性KG中的交互信息,使它具有推理逆关系和传递关系的能力;最后,UDConEx利用神经网络对KG的不确定信息进行置信度学习,在UKGE空间中可以进行近似推理。在CN15k、NL27k和PPI5k这3个公开数据集上的实验结果表明,相较于MUKGE(Multiplex UKGE)模型,UDConEx在CN15k、NL27k和PPI5k的置信度预测任务中平均绝对误差(MAE)分别降低了6.3%,30.1%和44.9%;在关系事实排名任务中,基于线性的归一化折损累计增益(NDCG)在CN15k和NL27k数据集中分别提升了5.8%和2.6%;在多关系近似推理任务中验证了UDConEx具有多种逻辑关系的近似推理能力。UDConEx弥补了传统嵌入模型无法进行置信度预测的不足,实现了对多种逻辑关系的近似推理,具有更精确、具有可解释性的不确定性知识图谱推理能力。

    基于Transformer和关系图卷积网络的信息传播预测模型
    吕锡婷, 赵敬华, 荣海迎, 赵嘉乐
    2024, 44(6):  1760-1766.  DOI: 10.11772/j.issn.1001-9081.2023060884
    摘要 ( )   HTML ( )   PDF (2150KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对在信息传播动态演化中,结构特征和时序特征以及两者间的交互表达难以有效捕获的问题,提出一种基于Transformer和关系图卷积网络的信息传播预测模型(TRGCN)。首先,构建由社交关系图和传播级联图组合而成的异构图,使用关系图卷积网络(RGCN)提取图中各节点的结构特征;其次,使用双向长短期记忆(Bi-LSTM)网络对各节点的时间嵌入重新编码,引入时间衰减项以不同的权重赋予不同时间位置的节点,获得节点的时序特征;最后,将结构特征和时序特征输入Transformer进行融合,得到时空特征以预测信息传播。在Twitter、Douban和Memetracker这3个真实数据集上的实验结果表明,相较于对比实验中的最优模型,TRGCN的Hits@100指标分别提升3.18%,5.96%和3.34%,Map@100指标分别提升11.60%,19.72%和8.47%,验证了所提模型的有效性和合理性。

    基于知识增强和提示学习的小样本新闻主题分类方法
    余新言, 曾诚, 王乾, 何鹏, 丁晓玉
    2024, 44(6):  1767-1774.  DOI: 10.11772/j.issn.1001-9081.2023050709
    摘要 ( )   HTML ( )   PDF (2029KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训练模型在训练集上学习最优的提示模板;其次,将提示模板与输入文本结合,使分类任务转化为完形填空任务;同时利用外部知识扩充标签词空间,丰富标签词的语义信息;最后,对预测的标签词与原始的标签进行映射。通过在THUCNews、SHNews和Toutiao这3个新闻数据集上进行随机采样,形成小样本训练集和验证集进行实验。实验结果表明,所提方法在上述数据集上的1-shot、5-shot、10-shot和20-shot任务上整体表现有所提升,尤其在1-shot任务上提升效果突出,与基线小样本分类方法相比,准确率分别提高了7.59、2.11和3.10个百分点以上,验证了KPL在小样本新闻主题分类任务上的有效性。

    基于多粒度语义融合的信息检索方法
    赵征宇, 罗景, 涂新辉
    2024, 44(6):  1775-1780.  DOI: 10.11772/j.issn.1001-9081.2023050646
    摘要 ( )   HTML ( )   PDF (1551KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    信息检索(IR)是一种通过特定的技术和方法组织、处理信息,以满足用户的信息需求的过程。近年来,基于预训练模型的稠密检索方法取得了巨大的成功;然而,这些方法只利用了文本和词语的向量表征计算查询与文档相关度,忽略了它们短语层面间的语义信息。针对该问题,提出一种名为MSIR(Multi-Scale IR)的IR方法。所提方法通过融合查询与文档中多种不同粒度的语义信息提高IR性能。首先,构建查询和文档中词语、短语和文本这3个粒度的语义单元;其次,利用预训练模型对这3个语义单元分别进行编码获得它们的语义表征;最后,利用语义表征计算查询和文档相关度。在Corvid-19、TREC2019和Robust04这3个不同大小的经典数据集上进行了对比实验。与ColBERT(ranking model based on Contextualized late interaction over BERT (Bidirectional Encoder Representation from Transformers))相比,MSIR在Robust04数据集的P@10、P@20、NDCG@10和NDCG@20指标上均实现了约8%的提升,同时在Corvid-19和TREC2019数据集上也取得了一定的改进。实验结果表明,MSIR能够成功融合多种语义粒度,提升检索精度。

    生成式标签对抗的文本分类模型
    姚迅, 秦忠正, 杨捷
    2024, 44(6):  1781-1785.  DOI: 10.11772/j.issn.1001-9081.2023050662
    摘要 ( )   HTML ( )   PDF (1142KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    文本分类是自然语言处理(NLP)中的一项基础任务,目的是将文本数据分配至预先定义的类别。图卷积神经网络(GCN)与大规模的预训练模型BERT(Bidirectional Encoder Representations from Transformer)的结合在文本分类任务中取得了良好的效果。大规模异构图中GCN的无向的信息传递产生信息噪声影响模型的判断,造成模型分类能力下降,针对这一问题,提出一种生成式标签对抗模型,即类对抗图卷积网络(CAGCN)模型,以降低分类时无关信息的干扰,提升模型的分类性能。首先,采用TextGCN(Text Graph Convolutional Network)中的构图法构建邻接矩阵,结合GCN和BERT模型作为类生成器(CG);其次,在模型训练时采用伪标签特征训练法,并构建聚类器与类生成器联合训练;最后,在多个广泛使用的数据集上进行实验。实验结果表明,在泛用的分类数据集20NG、R8、R52、Ohsumed和MR上,CAGCN模型的分类准确率比RoBERTaGCN模型分别提高了1.2、0.1、0.5、1.7和0.5个百分点。

    融合强关联依赖和简洁语法的方面级情感分析模型
    柯添赐, 刘建华, 孙水华, 郑智雄, 蔡子杰
    2024, 44(6):  1786-1795.  DOI: 10.11772/j.issn.1001-9081.2023050638
    摘要 ( )   HTML ( )   PDF (2399KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对语法依赖树存在多个方面词相互干扰的依赖信息、无效单词,以及标点符号带来的冗余信息和方面词与对应情感词之间的关联性较弱等问题,提出一种融合强关联依赖和简洁语法的方面级情感分析模型(SADCS)。首先,构建情感词性(POS)列表,通过该列表加强方面词与对应情感的相关性;其次,构建融合POS和依赖关系的联合列表,通过该联合列表去除已优化的依赖树无效单词与标点符号的冗余信息;再次,将优化后的依赖树与图注意力网络(GAT)结合建模提取上下文特征;最后,与依赖关系类型的特征信息进行交互学习并融合特征,增强特征表示,最终使分类器能高效预测每个方面词的情感极性。将所提模型在4个公开数据集上进行实验分析,与DMF-GAT-BERT(Dynamic Multichannel Fusion mechanism based on the GAT and BERT (Bidirectional Encoder Representations from Transformers))模型相比,所提模型的准确率分别提高了1.48、1.81、0.09和0.44个百分点。实验结果表明,所提模型能够有效增强方面词与情感词的联系,使方面词情感极性的预测更准确。

    基于改进的提示学习方法的双通道情感分析模型
    沈君凤, 周星辰, 汤灿
    2024, 44(6):  1796-1806.  DOI: 10.11772/j.issn.1001-9081.2023060733
    摘要 ( )   HTML ( )   PDF (3205KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对先前提示学习方法中存在的模板迭代更新周期长、泛化能力差等问题,基于改进的提示学习方法提出一种双通道的情感分析模型。首先,将序列化后的提示模板与输入词向量一起引入注意力机制结构,在输入词向量在多层注意力机制中更新的同时迭代更新提示模板;其次,在另一通道采用ALBERT(A Lite BERT (Bidirectional Encoder Representations from Transformers))模型提取语义信息;最后,输出用集成方式提取的语义特征,提升整体模型的泛化能力。所提模型在SemEval2014的Laptop和Restaurants数据集、ACL(Association for Computational Linguistics)的Twitter数据集和斯坦福大学创建的SST-2数据集上进行实验,分类准确率达到80.88%、91.78%、76.78%和95.53%,与基线模型BERT_Large相比,分别提升0.99%、1.13%、3.39%和2.84%;与P-tuning v2相比,所提模型的分类准确率在Restaurants数据集、Twitter数据集以及SST-2数据集上分别有2.88%、3.60%和2.06%的提升,且比原方法更早达到收敛状态。

    基于随机噪声和自适应步长的快速对抗训练方法
    吴锦富, 柳毅
    2024, 44(6):  1807-1815.  DOI: 10.11772/j.issn.1001-9081.2023060774
    摘要 ( )   HTML ( )   PDF (1851KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    当前对抗训练(AT)及其变体被证明是防御对抗攻击的最有效方法,但生成对抗样本的过程需要庞大的计算资源,导致模型训练效率低、可行性不强;快速AT(Fast-AT)使用单步对抗攻击代替多步对抗攻击加速训练过程,但模型鲁棒性远低于多步AT方法且容易发生灾难性过拟合(CO)。针对这些问题,提出一种基于随机噪声和自适应步长的Fast-AT方法。首先,在生成对抗样本的每次迭代中,通过对原始输入图像添加随机噪声增强数据;其次,累积训练过程中每个对抗样本的梯度,并根据梯度信息自适应地调整对抗样本的扰动步长;最后,根据步长和梯度进行对抗攻击,生成对抗样本用于模型训练。在CIFAR-10、CIFAR-100数据集上进行多种对抗攻击,相较于N-FGSM(Noise Fast Gradient Sign Method),所提方法在鲁棒准确率上取得了至少0.35个百分点的提升。实验结果表明,所提方法能避免Fast-AT中的CO问题,提高深度学习模型的鲁棒性。

    基于Graph Transformer的半监督异配图表示学习模型
    黎施彬, 龚俊, 汤圣君
    2024, 44(6):  1816-1823.  DOI: 10.11772/j.issn.1001-9081.2023060811
    摘要 ( )   HTML ( )   PDF (2420KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的图卷积网络(GCN)模型基于同配性假设,无法直接应用于异配图的表示学习,且许多异配图表示学习的研究工作受消息传递机制的限制,导致节点特征混淆和特征过度挤压而出现过平滑问题。针对这些问题,提出一种基于Graph Transformer的半监督异配图表示学习模型HPGT(HeteroPhilic Graph Transformer)。首先,使用度连接概率矩阵采样节点的路径邻域,再通过自注意力机制自适应地聚合路径上的节点异配连接模式,编码得到节点的结构信息,用节点的原始属性信息和结构信息构建Transformer层的自注意力模块;其次,将每个节点自身的隐层表示与它的邻域节点的隐层表示分离更新以避免节点通过自注意力模块聚合过量的自身信息,再把每个节点表示与它的邻域表示连接,得到单个Transformer层的输出,另外,将所有的Transformer层的输出跳连到最终的节点隐层表示以防止中间层信息丢失;最后,使用线性层和Softmax层将节点的隐层表示映射到节点的预测标签。实验结果表明,与无结构编码(SE)的模型相比,基于度连接概率的SE能为Transformer层的自注意力模块提供有效的偏差信息,HPGT平均准确率提升0.99%~11.98%;与对比模型相比,在异配数据集(Texas、Cornell、Wisconsin和Actor)上,模型节点分类准确率提升0.21%~1.69%,在同配数据集(Cora、CiteSeer和PubMed)上,节点分类准确率分别达到了0.837 9、0.746 7和0.886 2。以上结果验证了HPGT具有较强的异配图表示学习能力,尤其适用于强异配图节点分类任务。

    数据科学与技术
    较短的长序列时间序列预测模型
    徐泽鑫, 杨磊, 李康顺
    2024, 44(6):  1824-1831.  DOI: 10.11772/j.issn.1001-9081.2023060799
    摘要 ( )   HTML ( )   PDF (2751KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的研究大多将短序列时间序列预测和长序列时间序列预测分开研究而导致模型在较短的长序列时序预测时精度较低的问题,提出一种较短的长序列时间序列预测模型(SLTSFM)。首先,利用卷积神经网络(CNN)和PBUSM(Probsparse Based on Uniform Selection Mechanism)自注意力机制搭建一个序列到序列(Seq2Seq)结构,用于提取长序列输入的特征;其次,设计“远轻近重”策略将多个短序列输入特征提取能力较强的长短时记忆(LSTM)模块提取的各时段数据特征进行重分配;最后,用重分配的特征增强提取的长序列输入特征,提高预测精度并实现时序预测。利用4个公开的时间序列数据集验证模型的有效性。实验结果表明,与综合表现次优的对比模型循环门单元(GRU)相比,SLTSFM的平均绝对误差(MAE)指标在4个数据集上的单变量时序预测分别减小了61.54%、13.48%、0.92%和19.58%,多变量时序预测分别减小了17.01%、18.13%、3.24%和6.73%。由此可见SLTSFM在提升较短的长序列时序预测精度方面的有效性。

    基于正交局部保持映射和成本优化的多变量时间序列早期分类模型
    袁子璇, 翁小清, 戈宁振
    2024, 44(6):  1832-1841.  DOI: 10.11772/j.issn.1001-9081.2023060761
    摘要 ( )   HTML ( )   PDF (1806KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    时间序列早期分类(ETSC)有两个矛盾的目标:早期性和准确率。分类早期性的实现,总是以牺牲它的准确率为代价。现有基于优化的多变量时间序列(MTS)早期分类方法,虽然在成本函数中考虑了错误分类成本和延迟决策成本,却忽视了MTS数据集样本之间的局部结构对分类性能的影响。针对这个问题,提出一种基于正交局部保持映射(OLPP)和成本优化的MTS早期分类模型(OLPPMOAE)。首先,使用OLPP将MTS样本前缀映射到低维空间,保持原数据集的局部结构;其次,在低维空间训练一组高斯过程(GP)分类器,生成训练集每个时刻的类概率;最后,使用粒子群优化(PSO)算法从这些类概率中学习停止规则中的最优参数。在6个MTS数据集上的实验结果表明,在早期性基本持平的情况下,OLPPMOAE的准确率显著高于基于成本的R1_Clr(stopping Rule and Cost function with regularization term l1 and l2)模型,平均准确率能够提升11.33%~15.35%,调和均值(HM)能够提升4.71%~9.01%。因此,所提模型能够以较高的准确率尽早地分类MTS。

    时频域多尺度交叉注意力融合的时间序列分类方法
    王美, 苏雪松, 刘佳, 殷若南, 黄珊
    2024, 44(6):  1842-1847.  DOI: 10.11772/j.issn.1001-9081.2023060731
    摘要 ( )   HTML ( )   PDF (2511KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对时间序列子序列间的潜在信息交互不足导致分类准确率低的问题,提出时频域多尺度交叉注意力融合的时间序列分类方法TFFormer(Time-Frequency Transformer)。首先,将原始时间序列的时频域谱分别划分为等长子序列,经线性投影后加入位置信息解决时间序列的点值耦合问题;其次,通过改进的多头自注意力(IMHA)模块使模型关注更重要的序列特征,解决长时间序列的前后依赖问题;最后,构造多尺度时频域交叉注意力(CMA)模块增强时间序列在时域和频域之间的信息交互,使模型进一步挖掘序列的频域信息。实验结果表明,在Trace、StarLightCurves和UWaveGestureLibraryAll数据集上,相较于全卷积网络(FCN),所提方法的分类准确率分别提高了0.3、0.9和1.4个百分点,验证了通过增强时间序列时域和频域间的信息交互,可以提高模型收敛速度和分类精度。

    用于时态聚合范围查询的分布式时态索引
    孟繁珺, 韩斌, 黄树成, 梅向东
    2024, 44(6):  1848-1854.  DOI: 10.11772/j.issn.1001-9081.2023060830
    摘要 ( )   HTML ( )   PDF (1444KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在大数据与云计算时代,时态大数据的查询分析面临许多重要挑战。针对其中时态聚合范围查询性能不佳和不能有效利用索引等问题,提出一种用于时态聚合范围查询的分布式时态索引(DTI)。首先,采用随机或轮询策略对时态数据分区;其次,采用基于时间位数组前缀的分区内索引构造算法建立索引,同时记录包括时间跨度在内的分区统计信息;再次,利用谓词下推筛选时间跨度与查询时间区间重叠的数据分区,扫描索引进行预聚合;最后,将各分区得到的预聚合值按时间归并并聚合。实验结果表明,索引的分区内构造算法处理时间密度2 400条每单位时间和0.001条每单位时间的数据的执行时间相近。索引的聚合查询算法相较于ParTime算法:在查询时间线前75%的数据时,每一步用时都至少减少22%;执行选择型聚合函数时,每一步用时都至少减少11%。因此,索引在多数时态聚合范围查询任务中具有更高的速度,它的分区内构造算法能解决数据稀疏问题且执行效率高。

    基于局部扩展社区发现的学术异常引用群体检测
    林欣蕊, 王晓菲, 朱焱
    2024, 44(6):  1855-1861.  DOI: 10.11772/j.issn.1001-9081.2023050702
    摘要 ( )   HTML ( )   PDF (1689KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    学术社交网络中的某些学者可能组成异常引用群体,相互之间过度引用彼此的文章以谋取利益。现有的异常群体检测算法大多将社区检测与节点表示学习分离,导致最终异常群体检测性能受限。为此,提出一种基于局部扩展社区发现的异常引用群体检测(GADL)算法。所提算法利用论文研究领域、标题内容等语义信息提取作者异常引用特征;定义基于节点转移相似度、节点社区隶属度、引用异常度和广度优先遍历(BFS)深度的扩展度量函数;结合异常社区发现和异常节点检测,在统一框架下对二者联合优化,可获得最优的异常检测性能。在ACM、DBLP1和DBLP2数据集上,相较于ALP算法,所提算法分别提高了6.07%、5.35%和3.38%。在真实数据集上的实验结果表明,所提算法可有效地检测异常学术引用。

    网络空间安全
    基于机器学习的多目标缓存侧信道攻击检测模型
    姚梓豪, 栗远明, 马自强, 李扬, 魏良根
    2024, 44(6):  1862-1871.  DOI: 10.11772/j.issn.1001-9081.2023060787
    摘要 ( )   HTML ( )   PDF (3387KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    当前缓存侧信道攻击检测技术主要针对单一攻击模式,对2~3种攻击的检测方法有限,无法全面覆盖;此外,尽管对单一攻击的检测精度高,但随着攻击数增加,精度下降,容易产生误报。为了有效检测缓存侧信道攻击,利用硬件性能计数器(HPC)采集不同的缓存侧信道攻击特征,结合机器学习算法,提出一种基于机器学习的多目标缓存侧信道攻击检测模型。首先,分析不同缓存侧信道攻击方式的相关特征,精选关键特征并收集数据集;其次,进行独立的训练,建立针对每种攻击方式的检测模型;最后,在检测时将测试数据并行送入多个模型中,根据检测结果判断是否存在某种缓存侧信道攻击。实验结果显示,所提模型在检测Flush+Reload、Flush+Flush和Prime+Probe这3种缓存侧信道攻击时,分别达到99.91%、98.69%和99.54%的高准确率,即使在同时存在多种攻击的情况下,也能准确识别各种攻击方式。

    融合秘密分享技术的双重纵向联邦学习框架
    罗玮, 刘金全, 张铮
    2024, 44(6):  1872-1879.  DOI: 10.11772/j.issn.1001-9081.2023060862
    摘要 ( )   HTML ( )   PDF (1227KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对水电行业中的跨媒体数据融合建模和隐私保护的问题,提出一种融合秘密分享技术的双重纵向联邦学习框架。首先,将各参与方节点进行分层,其中底层节点负责预建模,中间层节点负责预模型汇总与优化,中心方节点则生成最终模型;其次,为强化数据隐私性保护和防范推理攻击,引入基于秘密分享技术的中间参数保护机制,在该机制中数据拥有者与模型训练方之间的通信数据被碎片化分割,以确保模型参数与训练者的对应关系的隐蔽性,提高攻击者推理攻击的难度;最后,为优化联邦学习的模型聚合过程,引入基于信息量差异的节点评估机制,该机制综合考虑节点的相异度和数据量,精细权衡不同节点在模型聚合中的权重,并剔除疑似的恶意节点的贡献,从而优化模型的性能和收敛速度。实验数据集选取国电大渡河流域水电开发有限公司的真实数据,结果显示:基于秘密分享技术的中间参数保护机制相较于差分隐私保护机制,收敛过程更稳定,收敛速度提升约14.6%;引入基于信息量差异的节点评估机制,相较于联邦平均算法,收敛速度提升约13.5%。可见,所提框架解决了水电数据的跨媒体数据融合建模问题,并具有数据隐私保护和模型收敛加速的优势。

    基于二维模运算的高效率可逆信息隐藏方案
    李越, 唐聃, 孙敏钧, 王燮, 蔡红亮, 曾琼
    2024, 44(6):  1880-1888.  DOI: 10.11772/j.issn.1001-9081.2023060900
    摘要 ( )   HTML ( )   PDF (6712KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对在较大数据量传递的场景中使用可逆信息隐藏(RDH)保护数据时嵌入效率和抗检测能力较低的问题,提出一种基于二维模运算的高效率可逆信息隐藏方案。首先通过模运算较小的修改像素值嵌入较大的信息量,再结合增强的进制转换系统增加嵌入位数,最后使用折半法结合双图像赋予可逆性。在USC-SIPI标准图像库上进行的仿真实验结果表明,在嵌入高达100万比特秘密信息时,所提方案的隐写图像的峰值信噪比(PSNR)值保持在40 dB左右,且该隐写图像可有效抵抗RS(Regular Singular)隐写分析、像素差直方图(PDH)隐写分析和位平面隐写分析的静态攻击。因此,所提方案有效提高了对原始图像的嵌入效率,同时具有良好的抗检测能力。

    先进计算
    降低跨分片交易比例的区块链分片方法
    李皎, 张秀山, 宁远航
    2024, 44(6):  1889-1896.  DOI: 10.11772/j.issn.1001-9081.2023060757
    摘要 ( )   HTML ( )   PDF (2573KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对分片技术在优化区块链性能时引起的跨分片交易比例过高、跨分片交易验证复杂的问题,提出一种降低跨分片交易比例的区块链分片方法。首先,从数据分片的角度出发,构造区块链交易分片模型,并给出分片性能评价指标;其次,针对区块链中长期积累的交易数据,从账号关联性角度出发,构造发送方和接收方的交易频次集合;最后,设计考虑交易频次的区块链交易分片算法(FBTS),从而解决交易分片中跨分片比例过高的问题。在分片粒度为2、3、5、7、15、20、30和50的情况下,所提算法在跨分片交易比例、账号平均跨分片次数、账号的加权平均跨分片次数等性能指标方面均优于随机分片算法(RSA)和取模分片算法(MSA)。另外所提算法的大多数账号和交易量都集中分布在低跨分片次数处,说明交易的完成不需要多次跨分片。实验结果表明,所提算法可以有效地降低跨分片交易比例,缩短跨分片的交易的时延。

    多车场带时间窗车辆路径问题的改良自适应大邻域搜索算法
    李焱, 潘大志, 郑思情
    2024, 44(6):  1897-1904.  DOI: 10.11772/j.issn.1001-9081.2023060760
    摘要 ( )   HTML ( )   PDF (2184KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对多车场带时间窗车辆路径问题(MDVRPTW),提出一种改良自适应大邻域搜索算法(IALNS)。首先,在构造初始解阶段改进一种路径分割算法;其次,在优化阶段利用设计的移除和修复启发式算子相互竞争择优选取算子,为各算子引入评分机制,采用轮盘赌方式选取启发式算子;同时,将迭代周期分段,动态调整各周期内的算子权重信息,有效避免算法陷入局部最优;最后,采取模拟退火机制作为解的接受准则。在Cordeau规范算例上进行实验,确定IALNS的相关参数,将所提算法求解结果与该领域其他代表性研究成果对比。实验结果表明,所提算法与变邻域搜索(VNS)算法的求解误差不超过0.8%,在某些算例上甚至更优;与多相位改进的蛙跳算法相比,算法的平均耗时减少12.8%,所提算法在绝大多数算例上运行时间更短。因此,验证了所提算法是求解MDVRPTW的有效算法。

    基于DenseNet的经典-量子混合分类模型
    翟飞宇, 马汉达
    2024, 44(6):  1905-1910.  DOI: 10.11772/j.issn.1001-9081.2023050656
    摘要 ( )   HTML ( )   PDF (2793KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的图像分类模型越来越复杂,计算时所需的硬件资源和计算时间不断增加。针对该问题提出一种基于DenseNet的经典-量子混合分类模型(CQDenseNet模型)。首先,使用一个可在噪声中尺度量子(NISQ)设备上运行的变分量子电路(VQC)作为分类器,替换DenseNet全连接层;其次,使用迁移学习,利用在ImageNet数据集上预先训练好的DenseNet模型作为CQDenseNet的预训练模型;最后,将CQDenseNet模型在中草药分类数据集和CIFAR-100数据集上与基准模型AlexNet、GoogLeNet、VGG19、ResNet和DenseNet-169进行对比。实验结果表明,CQDenseNet模型比所有基准模型中表现最好的基准模型:准确率分别提高了2.2、7.4个百分点,精确率分别提高了2.2、7.3个百分点,召回率分别提高了2.2、7.1个百分点,F1值分别提高了2.3、6.4个百分点,说明了经典-量子混合模型的性能优于经典模型。

    多媒体计算与计算机仿真
    基于层间引导的低光照图像渐进增强算法
    黄梦源, 常侃, 凌铭阳, 韦新杰, 覃团发
    2024, 44(6):  1911-1919.  DOI: 10.11772/j.issn.1001-9081.2023060736
    摘要 ( )   HTML ( )   PDF (6161KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    低光照图像的图像质量通常较低,低光照图像增强(LLIE)旨在提高这类图像的视觉质量。针对现有的LLIE算法大多专注增强亮度和对比度、忽略细节增强的问题,提出一个基于层间引导的低光照图像渐进增强算法(PELG),兼顾图像亮度和细节增强。首先,使用拉普拉斯金字塔(LP)降低任务复杂度,提高算法效率;其次,利用各频率分量间的相关性,在低频和高频分量之间构建基于Transformer的层间引导融合模块,在各高频分量之间构建轻量级的层间引导融合模块,有效精炼金字塔较低层增强信息指导较高层处理图像,实现基于层间引导的渐进增强;最后,通过LP重建亮度均匀、细节清晰的增强图像。实验结果表明,所提算法的峰值信噪比(PSNR)在LOL(LOw-Light dataset)-v1上比DSLR(Deep Stacked Laplacian Restorer)高2.3 dB,在LOL-v2上比UNIE(Unsupervised Night Image Enhancement)高0.55 dB;与其他基于深度学习的LLIE算法相比,所提算法运行速度快,增强结果在客观和主观质量上均获得明显提升,更适用于实际场景。

    基于筛选学习网络的六自由度目标位姿估计算法
    邴雅星, 王阳萍, 雍玖, 白浩谋
    2024, 44(6):  1920-1926.  DOI: 10.11772/j.issn.1001-9081.2023060866
    摘要 ( )   HTML ( )   PDF (2113KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对在复杂场景下对弱纹理目标位姿估计的准确性和实时性问题,提出基于筛选学习网络的六自由度(6D)目标位姿估计算法。首先,将标准卷积替换为蓝图可分离卷积(BSConv)以减少模型参数,并使用GeLU(Gaussian error Linear Unit)激活函数,能够更好地逼近正态分布,以提高网络模型的性能;其次,提出上采样筛选编码信息模块(UFAEM),弥补了上采样关键信息丢失的缺陷;最后,提出一种全局注意力机制(GAM),增加上下文信息,更有效地提取输入特征图的信息。在公开数据集LineMOD、YCB-Video和Occlusion LineMOD上测试,实验结果表明,所提算法在网络参数大幅度减少的同时提升了精度。所提算法网络参数量减少近3/4,采用ADD(-S) metric指标,在lineMOD数据集下较Dual-Stream算法精度提升约1.2个百分点,在YCB-Video数据集下较DenseFusion算法精度提升约5.2个百分点,在Occlusion LineMOD数据集下较像素投票网络(PVNet)算法精度提升约6.6个百分点。通过实验结果可知,所提算法对弱纹理目标位姿估计具有较好的效果,对遮挡物体位姿估计具有一定的鲁棒性。

    基于多尺度和加权坐标注意力的轻量化红外道路场景检测模型
    程小辉, 黄云天, 张瑞芳
    2024, 44(6):  1927-1934.  DOI: 10.11772/j.issn.1001-9081.2023060775
    摘要 ( )   HTML ( )   PDF (3120KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对道路场景下红外目标遮挡、缺乏纹理细节而导致目标误检、漏检的问题,提出一种基于多尺度和加权坐标注意力的轻量化红外道路场景检测模型(MSC-YOLO)。以YOLOv7-tiny作为基线模型,首先,在MobileNetV3的不同中间特征层引入多尺度金字塔模块PSA(Pyramid Split Attention),设计一种多尺度特征提取的轻量化主干提取网络MSM-Net(Multi-Scale Mobile Network),解决固定大小卷积核造成的特征污染问题,提高对于不同尺度目标的细粒度提取能力;其次,在特征融合网络融入加权坐标注意力(WCA)机制,叠加从中间特征图垂直和水平空间方向上获取的目标位置信息,增强目标特征在不同维度上的融合能力;最后,替换定位损失函数为高效交并比(EIoU),分别计算预测框和真实框的长、宽影响因子,提高收敛速度。在Flir数据集上进行验证实验,与YOLOv7-tiny模型相比,在mAP(IoU=0.5)仅降低0.7个百分点的前提下,MSC-YOLO的参数量减少67.3%,浮点运算次数减少54.6%,模型大小减小60.5%,帧率在RTA 2080Ti上达到101,在检测性能和轻量化上达到平衡,满足红外道路场景的实时检测需求。

    基于ResNet50和改进注意力机制的船舶识别模型
    刘源泂, 何茂征, 黄益斌, 钱程
    2024, 44(6):  1935-1941.  DOI: 10.11772/j.issn.1001-9081.2023060859
    摘要 ( )   HTML ( )   PDF (5065KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    海洋船舶的自动识别对缓解海上交通压力起着重要作用。针对当前船舶自动识别率较低的问题,提出一种基于ResNet50(Residual Network50)和改进注意力机制的船舶识别模型。首先,自制船舶数据集并划分为训练集、验证集和测试集,采用模糊、增加噪声等方法得到增强数据集;其次,设计改进注意力模块——高效空间金字塔注意力模块(ESPAM)和船舶种类识别模型ResNet50_ESPAM;最后,将ResNet50_ESPAM与其他常用的神经网络模型对船舶数据集进行训练验证并对比。实验结果表明,ResNet50_ESPAM在验证集最高准确率为95.5%,验证集初始准确率为81.2%,与AlexNet(Alex Krizhevsky Network)、GoogleNet(Google Inception Net)、ResNet34(Residual Network34)、ResNet50和ResNet50_CBAM(ResNet50_ Convlutional Block Attention Module)等模型相比,模型验证集最高准确率分别提升了5.1、4.9、2.6、1.6和1.4个百分点,验证集初始准确率分别提升了49.4、44.7、27.7、3.0和2.1个百分点。实验结果表明ResNet50_ESPAM在船舶种类识别方面具有较高的识别精度,验证了改进的注意力模块ESPAM的有效性。

    用于脑卒中病灶分割的具有注意力机制的校正交叉伪监督方法
    周妍, 李阳
    2024, 44(6):  1942-1948.  DOI: 10.11772/j.issn.1001-9081.2023060742
    摘要 ( )   HTML ( )   PDF (1757KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    脑部病变的自动分割为脑卒中患者的及时诊治和诊疗方案的制定提供了可靠的依据,但获取大规模标记数据昂贵且耗时。半监督学习(SSL)方法通过利用大量的未标记图像和有限的标记图像缓解这一问题。针对SSL中伪标签存在噪声,以及现有的三维(3D)网络缺乏聚焦较小目标的能力这2个问题,提出一种半监督方法,即用于脑卒中病灶分割的具有注意力机制的校正交叉伪监督方法RPE-CPS(Rectified Cross Pseudo Supervision with Project & Excite modules)。首先,将数据输入2个结构相同但初始化不同的3D U-Net分割网络,将得到的伪分割图用于交叉监督训练分割网络,充分利用伪标签数据扩展训练集,并鼓励不同初始化网络对同一输入图像的预测之间具有较高的相似性;其次,设计一种基于不确定性估计的交叉伪监督方法的校正策略,以降低伪标签中的噪声影响;最后,在3D U-Net分割网络中,为提高小目标类的分割性能,将投影-激发(PE)模块添加至每一个编码器模块、解码器模块和瓶颈模块之后。为验证所提方法的有效性,在合作医院急性缺血性脑卒中(AIS)数据集和缺血性脑卒中病灶分割挑战赛(ISLES2022)数据集上分别进行评估实验。实验结果表明,在仅使用训练集中20%的标记数据时,在公开数据集ISLES2022上Dice相似系数(DSC)、95%豪斯多夫距离(HD95)和平均表面距离(ASD)分别达到了73.87%、6.08 mm和1.31 mm;在AIS数据集上DSC、HD95和ASD分别达到了67.74%、15.38 mm和1.05 mm。与先进的半监督方法不确定性校正金字塔(URPC)相比,DSC分别提升了2.19和3.43个百分点。所提方法可以有效地利用未标记数据提高分割精度,优于其他半监督方法,并具有鲁棒性。

    前沿与综合应用
    YOLO算法及其在自动驾驶场景中目标检测综述
    邓亚平, 李迎江
    2024, 44(6):  1949-1958.  DOI: 10.11772/j.issn.1001-9081.2023060889
    摘要 ( )   HTML ( )   PDF (1175KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    自动驾驶场景下的目标检测是计算机视觉中重要研究方向之一,确保自动驾驶汽车对物体进行实时准确的目标检测是研究重点。近年来,深度学习技术迅速发展并被广泛应用于自动驾驶领域中,极大促进了自动驾驶领域的进步。为此,针对YOLO(You Only Look Once)算法在自动驾驶领域中的目标检测研究现状,从以下4个方面分析。首先,总结单阶段YOLO系列检测算法思想及其改进方法,分析YOLO系列算法的优缺点;其次,论述YOLO算法在自动驾驶场景下目标检测中的应用,从交通车辆、行人和交通信号识别这3个方面分别阐述和总结研究现状及应用情况;此外,总结目标检测中常用的评价指标、目标检测数据集和自动驾驶场景数据集;最后,展望目标检测存在的问题和未来发展方向。

    基于模型预测控制的自动驾驶车辆轨迹规划
    葛超, 张嘉滨, 王蕾, 伦志新
    2024, 44(6):  1959-1964.  DOI: 10.11772/j.issn.1001-9081.2023050725
    摘要 ( )   HTML ( )   PDF (2720KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为帮助自动驾驶车辆规划一条安全、舒适和高效的行驶轨迹,提出一种基于模型预测控制的轨迹规划方法。首先,为简化规划的环境,提出一种安全、可行的“三圆”膨胀化的安全区,避免车辆理想化模型引发的碰撞问题;其次,将轨迹规划进行横、纵向空间解耦,横向规划使用模型预测的方法生成一系列满足行驶要求的候选轨迹,纵向规划使用动态规划方法,提高规划的效率;最后,综合考虑影响最优轨迹挑选的因素,提出更符合行驶要求的路径规划和速度规划的最优轨迹评价函数,并通过Matlab/Simulink、Prescan和Carsim软件的联合仿真验证所提算法的有效性。实验结果表明,车辆的舒适度指标、方向盘转角变化和定位精度等均达到预期效果,规划曲线与跟踪曲线完美贴合,验证了所提算法的优越性。

    基于双支路卷积网络的步态识别方法
    王晓路, 千王菲
    2024, 44(6):  1965-1971.  DOI: 10.11772/j.issn.1001-9081.2023060897
    摘要 ( )   HTML ( )   PDF (1361KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对步态识别易受拍摄视角、外观变化等影响的问题,提出一种基于双支路卷积网络的步态识别方法。首先,提出随机裁剪随机遮挡的数据增强方法RRDA(Restricted Random Data Augmentation),以扩展外观变化的数据样本,提高模型遮挡的鲁棒性;其次,采用结合注意力机制的两路复合卷积层(C-Conv)提取步态特征,一个分支通过水平金字塔映射(HPM)提取行人外观全局和最具辨识度的信息;另一分支通过多个并行的微动作捕捉模块(MCM)提取短时间的步态时空信息;最后,将两个分支的特征信息相加融合,再通过全连接层实现步态识别。基于平衡样本特征的区分能力和模型的收敛性构造联合损失函数,以加速模型的收敛。在CASIA-B步态数据集上进行实验,所提方法在3种行走状态下的平均识别率分别达到97.40%、93.67%和81.19%,均高于GaitSet方法、CapsNet方法、双流步态方法和GaitPart方法;在正常行走状态下比GaitSet方法的识别准确率提升了1.30个百分点,在携带背包状态下提升了2.87个百分点,在穿着外套状态下提升了10.89个百分点。实验结果表明,所提方法是可行、有效的。

    基于自注意力机制与图卷积的3D目标检测网络
    刘越, 刘芳, 武奥运, 柴秋月, 王天笑
    2024, 44(6):  1972-1977.  DOI: 10.11772/j.issn.1001-9081.2023060767
    摘要 ( )   HTML ( )   PDF (3215KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对三维(3D)目标检测过程中对骑行者、行人等小目标检测的准确性较低,难以适应城市复杂路况的问题,提出一种基于自注意力机制与图卷积的3D目标检测网络。首先,为获取更具有判别性的小目标特征,在主干网络中引入自注意力机制,使网络对小目标特征更敏感,增强网络特征的提取能力;其次,在自注意力机制的基础上构建特征融合模块,进一步丰富浅层网络特征,增强深层网络的特征表达能力;最后,引用动态图卷积预测目标的边界框,提高目标预测的准确性。在KITTI数据集上进行实验,将所提网络与TANet(Triple Attention Network)、IA-SSD(Instance-Aware Single-Stage Detector)等8种主流网络对比。实验结果表明,所提网络对行人的检测精度在简单、中等和困难这3个难度下比行人检测精度次优的TANet提高了12.12、13.82和11.03个百分点,对骑行者的检测精度在中等和困难上比IA-SSD提高了3.06和5.34个百分点。综上所述,所提网络可以更好地应用于小目标检测任务。

    基于调频连续波雷达的人体生命体征检测算法
    李牧, 骆宇, 柯熙政
    2024, 44(6):  1978-1986.  DOI: 10.11772/j.issn.1001-9081.2023060737
    摘要 ( )   HTML ( )   PDF (3361KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有雷达非接触生命体征检测精度低、实时性差等问题,提出一种基于调频连续波(FMCW)雷达的人体生命体征检测算法。首先,通过毫米波雷达获取生命体征信号;其次,利用改进的经验小波变换(EWT)算法,实现生命体征信号的自适应分解和重构,通过引入麻雀搜索算法(SSA)和模糊熵(FE)寻找频谱分割线的最优值;最后,通过改进频率插值的估计算法计算心率和呼吸频率。通过与医用重症监护仪进行对比实验验证所提算法的优越性和鲁棒性。实验结果表明,所提算法相较于小波变换(WT)算法、CEEMD(Complementary Ensemble Empirical Mode Decomposition)算法和VMD(Variational Mode Decomposition)算法,均方误差(MSE)分别减小了77.65、27.25和21.05,平均绝对百分比(MAPE)分别减小了7.33、4.33和3.42个百分点,实时性分别提高了0.72 s, 16.74 s和1.87 s。同时,利用所提算法也实现了对心率变异性(HRV)的检测。

2024年 44卷 10期
刊出日期: 2024-10-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会