当期目录

    2024年 第44卷 第11期 刊出日期:2024-11-10 封面下载 目录下载
    人工智能
    超图应用方法综述:问题、进展与挑战
    曾蠡, 杨婧如, 黄罡, 景翔, 罗超然
    2024, 44(11):  3315-3326.  DOI: 10.11772/j.issn.1001-9081.2023111629
    摘要 ( )   HTML ( )   PDF (795KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    超图是图的泛化,相较于普通图,它在复杂关系的高阶特征表达上具有显著优势。作为一种相对较新的数据结构,超图在应用领域正在发挥越来越大的作用,研究者采用超图模型及算法对现实世界中的具体问题进行建模、求解,有效地提升了解决问题的效率及质量。现有对超图的综述更多侧重于解决超图本身问题的理论及技术,缺乏对超图在具体应用场景下的建模及求解方法的归纳总结。为此,在总结介绍超图的一些基础概念后,分析了超图在各个主流应用场景下的应用方法、技术、共性问题及解决方案;通过对现有工作的归纳总结,阐述了超图运用于现实问题中仍然存在的一些问题与障碍;最后,对超图应用的未来研究方向进行了展望。

    基于图池化对比学习的图分类方法
    胡能兵, 蔡彪, 李旭, 曹旦华
    2024, 44(11):  3327-3334.  DOI: 10.11772/j.issn.1001-9081.2023101526
    摘要 ( )   HTML ( )   PDF (715KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在图分类任务中,现有的利用丢弃节点的图池化算法得到的图嵌入表示没有有效地利用丢弃节点蕴含的信息和图间节点信息,同时传统方法也没有针对图嵌入进行单独学习,限制了它在图分类任务上的部分性能。为克服上述传统方法的不足,提出一种有效利用丢弃节点信息的图嵌入方法——基于图池化对比学习的图分类方法(GPCL)。首先,利用图注意力机制学习每个节点相应的注意力分数,且根据注意力分数对节点进行排序并丢弃分数较低的节点;其次,将本图保留的节点作为正样本,将其他图被丢弃的部分节点作为负样本,而将图的嵌入表达作为目标节点,两两计算相似性分数,从而进行对比学习。实验结果表明:在D&D (Dobson PD-Doig AJ)、MUTAG、PROTEINS和IMDB-B数据集上,相较于仅使用注意力机制和分层池化的方法,GPCL在图分类任务上的准确率分别提升了5.79、15.54、5.42和1.75个百分点,验证了GPCL充分提高了图间信息的利用率,在图分类任务上表现良好。

    基于图卷积网络的掩码数据增强
    胡新荣, 陈静雪, 黄子键, 王帮超, 姚迅, 刘军平, 朱强, 杨捷
    2024, 44(11):  3335-3344.  DOI: 10.11772/j.issn.1001-9081.2023111645
    摘要 ( )   HTML ( )   PDF (788KB) ( )   PDF(mobile) (2025KB) ( 12 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对多项选择问答(MCQA)领域中原始数据信息不准确、样本质量低以及模型泛化能力差等问题,提出一种基于图卷积网络(GCN)的掩码数据增强模型GMDA(Graph convolution network-based MASK Data Augmentation)。该模型以GCN作为基础框架,首先将文章中的单词抽象为图节点,并利用问题-候选答案(QA)对节点进行连接,建立与相关的文章节点之间的联系;其次,计算节点之间的相似性,并应用掩码技术对图中的节点进行掩盖,从而生成增强样本;再次,利用GCN对增强样本进行特征扩充,以提升模型的信息表达能力;最后,引入打分器对原始样本和增强样本进行评分,并结合课程学习策略提高答案预测的准确性。综合评估实验结果表明:与RACE-M、RACE-H数据集上的最优基线模型EAM相比,所提模型GMDA的准确率分别平均提高了0.8、0.4个百分点,而与DREAM数据集上的最优基线模型STM(SelfTraining Method)相比,GMDA模型的准确率平均提高了1.4个百分点。此外,对比实验的结果也验证了GMDA模型在MCQA任务中的有效性,可为数据增强技术在该领域的进一步研究和应用提供帮助。

    基于相似度聚类和正则化的个性化联邦学习
    巫婕, 钱雪忠, 宋威
    2024, 44(11):  3345-3353.  DOI: 10.11772/j.issn.1001-9081.2023111693
    摘要 ( )   HTML ( )   PDF (1016KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    联邦学习(FL)应用场景中,常面临客户端数据异质性和不同任务需求需要提供个性化模型的问题,但现有的部分个性化联邦学习(PFL)算法中存在个性化与全局泛化的权衡问题,并且这些算法大多采用传统FL中根据客户端数据量加权聚合的方法,导致数据分布差异大的客户端模型性能变差,缺乏个性化聚合策略。针对上述问题,提出一种基于相似度聚类和正则化的PFL算法pFedSCR。pFedSCR算法在客户端本地更新阶段训练个性化模型和局部模型,其中:个性化模型在交叉熵损失函数中引入L2范数正则化,动态调整参考全局模型的程度,在汲取全局知识的基础上实现个性化;在服务端聚合阶段,根据客户端模型更新的相似度聚类,构建聚合权重矩阵,动态调整聚合权重,为不同客户端聚合个性化模型,让参数聚合策略具有个性化的同时解决数据异构问题。在CIFAR-10、MNIST、Fashion-MNIST 3个数据集上通过狄利克雷(Dirichlet)分布模拟了多种非独立同分布(Non-IID)数据场景,结果表明:pFedSCR算法在各种场景下的准确度和通信效率都优于经典算法FedProx和最新个性化算法FedPCL (Federated Prototype-wise Contrastive Learning)等联邦学习算法,最高可达到99.03%准确度。

    运动想象脑电图的空域特征迁移核学习方法
    杨思琪, 罗天健, 严宣辉, 杨光局
    2024, 44(11):  3354-3363.  DOI: 10.11772/j.issn.1001-9081.2023111593
    摘要 ( )   HTML ( )   PDF (1026KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    运动想象脑电(MI-EEG)信号在构建临床辅助康复的无创脑机接口(BCI)中获得了广泛关注。受限于不同被试者的MI-EEG信号样本分布存在差异,跨被试MI-EEG信号的特征学习成为研究重点。然而,现有的相关方法存在域不变特征表达能力弱、时间复杂度较高等问题,无法直接应用于在线BCI。为解决该问题,提出黎曼切空间特征迁移核学习(TKRTS)方法,并基于此构建了高效的跨被试MI-EEG信号分类算法。TKRTS方法首先将MI-EEG信号协方差矩阵投影至黎曼空间,并在黎曼空间上对齐不同被试者的协方差矩阵,同时提取黎曼切空间(RTS)特征;随后,学习RTS特征集上的域不变核矩阵,从而获得完备的跨被试MI-EEG特征表达,并通过该矩阵训练核支持向量机(KSVM)进行分类。为验证TKRTS方法的可行性与有效性,在3个公开数据集上分别进行多源域-单目标域以及单源域-单目标域的实验,平均分类准确率分别提升了0.81个百分点和0.13个百分点。实验结果表明,与主流方法对比,TKRTS方法提升了平均分类准确率并保持相似的时间复杂度。此外,消融实验结果验证了TKRTS方法对跨被试特征表达的完备性和参数不敏感性,适合构建在线脑接机口。

    基于浅层网络预测的元标签校正方法
    黄雨鑫, 黄贻望, 黄辉
    2024, 44(11):  3364-3370.  DOI: 10.11772/j.issn.1001-9081.2023111616
    摘要 ( )   HTML ( )   PDF (828KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对深度神经网络(DNN)对含有噪声标签的图像数据具有记忆行为而导致的过拟合问题,提出一种基于浅层神经网络预测的元标签校正方法。该方法采用弱监督训练方式,通过设置标签重加权网络对噪声数据进行加权操作,利用元学习方法使模型动态地学习噪声数据,并将模型中深层与浅层网络的预测输出作为伪标签训练模型,同时利用知识蒸馏算法使深层网络指导浅层网络训练,以有效缓解模型的记忆行为并提升模型鲁棒性。在CIFAR10/100、Clothing1M数据集上的实验结果表明,相较于元标签校正(MLC)方法,所提方法在对称噪声比例为60%与80%的CIFAR10数据集上的准确率分别提升了3.49、1.56个百分点;此外,在CIFAR100数据集的消融实验中,非对称噪声比例为40%时,所提方法比无预测标签训练的模型准确率最高提升了5.32个百分点,验证了所提方法的可行性与有效性。

    融合实体语义及结构信息的知识图谱推理
    王利琴, 张特, 许智宏, 董永峰, 杨国伟
    2024, 44(11):  3371-3378.  DOI: 10.11772/j.issn.1001-9081.2023111677
    摘要 ( )   HTML ( )   PDF (705KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前,图注意力网络(GAT)通过引入注意力机制对目标实体的邻域实体赋予不同权重并进行信息聚合,使得它更关注实体的局部邻域,忽略了图结构中实体和关系之间的拓扑结构;而且在多头注意力后将输出嵌入向量简单拼接或平均,导致注意力头之间相互独立,未能捕捉不同注意力头的重要语义信息。针对GAT应用于知识图谱(KG)推理任务时未充分挖掘实体结构信息和语义信息的问题,提出融合实体语义及结构信息的知识图谱推理(FESSI)模型。首先,使用TransE将实体和关系表示为同一空间的嵌入向量。其次,提出交互注意力机制,将GAT中多头注意力重新融合成多个混合注意力,增强注意力头之间的交互性,以提取目标实体更丰富的语义信息;同时,利用关系图卷积网络(R-GCN)提取实体的结构信息,并通过权重矩阵学习GAT和R-GCN的输出特征向量。最后,使用ConvKB作为解码器进行评分。在知识图谱数据集Kinship、NELL-995和FB15K-237上的实验结果表明,FESSI模型的效果优于多数对比模型,在3个数据集的平均倒数排名(MRR)指标上的结果分别为0.964、0.565和0.562。

    基于证据增强与多特征融合的文档级关系抽取
    颜新月, 杨淑群, 高永彬
    2024, 44(11):  3379-3385.  DOI: 10.11772/j.issn.1001-9081.2023101516
    摘要 ( )   HTML ( )   PDF (1096KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    文档级关系抽取(DocRE)的目的是识别文档中实体对之间存在的所有关系。针对证据句子和文档信息未能被有效利用以及实体多提及的问题,在使用证据增强上下文特征的基础上,构建一种多特征融合的文档级关系抽取模型EMF(Evidence Multi-feature Fusion)。首先,在实体前后加上实体类型,将关系文本特征与实体提及进行关联,以获得特定于关系的实体特征。其次,通过不同卷积核获得片段表示,并通过注意力机制获得实体对感知的多粒度片段级特征;同时,利用证据分布增强与实体对高度相关的上下文特征。最后,融合以上特征进行关系分类,并在推理时将获得的证据组成伪文档与原文档一起输入分类器进行关系分类。在DocRE数据集DocRED(Document-level Relation Extraction Dataset)上的实验结果表明,使用BERTbase作为预训练语言模型编码器时,相较于先进模型EIDER(EvIDence-Enhanced DocRE),所提模型EMF的Ign F1和F1分别提高了0.42和0.41个百分点,F1达到了62.89%。EMF模型更关注与实体和关系相关的部分,可提高抽取的精度,并具有较好的可解释性。

    数据科学与技术
    基于改进期望最大化算法的供应链网络边连接规则优化
    王中钰, 钱晓东
    2024, 44(11):  3386-3395.  DOI: 10.11772/j.issn.1001-9081.2023111596
    摘要 ( )   HTML ( )   PDF (1292KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对供应链网络在演化形成阶段,企业随机连接可能会导致网络稳定性和运作效率降低的问题,提出一种基于期望最大化(EM)算法的供应链网络连接改进算法。首先,将网络节点边的数量作为新参数加入算法,以更准确地确定新节点在供应链网络中拥有的边数;其次,在边数确定的情况下,提出剩余边连接规则,以增强节点的选择性和分化度;最后,在保证新企业节点能平稳运行的前提下,研究不同初始边数对网络演化的影响。仿真实验结果表明,与EM算法相比,所提改进算法仅需要迭代计算80次即可得到稳定的结果,并且在1 000个节点的规模内,得到的连边数量稳定在4附近,与实际供应链网络的演化过程相匹配。由此可见,所提算法对实际供应链网络的拟合效果明显优于EM算法。

    考虑社区规模不平衡的非重叠社区检测
    刘世梁, 王义, 马应龙
    2024, 44(11):  3396-3402.  DOI: 10.11772/j.issn.1001-9081.2023101536
    摘要 ( )   HTML ( )   PDF (659KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    社区检测有助于理解社交网络错综复杂的结构,但现有的大部分社区检测方法并未考虑社交网络中社区规模的不平衡,发现的社区结构较为单一且准确率较低。为此,提出基于初始社区结构局部扩展的社区检测方法(LEICS)。LEICS分为3个阶段:第一阶段,充分利用网络的层次结构信息和局部结构信息发现不同规模的初始社区结构;第二阶段,通过计算节点与社区内节点的连接强度和节点对社区的模块度贡献扩展初始社区,再利用标签传播算法(LPA)处理剩余节点;第三阶段,重新分配小于平均社区大小的不稳定社区中的节点,以进一步优化社区检测的结果。在12个真实世界网络和兰奇基内蒂-福图纳托-拉迪奇(LFR)仿真网络上的实验结果表明,相较于次优的局部平衡标签扩散(LBLD)算法,LEICS在Polbooks和YouTube网络上的归一化互信息(NMI)提高了至少5个百分点,它的准确性和鲁棒性在小规模和大规模网络中得到充分验证,这表明LEICS可以适应社区规模的不平衡。

    面向动态路网的移动对象分布式k近邻查询算法
    陈国祥, 于自强, 赵浩宇
    2024, 44(11):  3403-3410.  DOI: 10.11772/j.issn.1001-9081.2023101503
    摘要 ( )   HTML ( )   PDF (758KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    动态路网k近邻(kNN)查询是许多基于位置的服务(LBS)中的一个重要问题。针对该问题,提出一种面向动态路网的移动对象分布式kNN查询算法DkNN(Distributed kNN)。首先,将整个路网划分为部署于集群中不同节点中的多个子图;其次,通过并行地搜索查询范围所涉及的子图得到精确的kNN结果;最后,优化查询的搜索过程,引入查询范围剪枝策略和查询终止策略。在4个道路网络数据集上与3种基线算法进行了充分对比和验证。实验结果显示,与TEN*-Index (Tree dEcomposition based kNN* Index)算法相比,DkNN算法的查询时间减少了56.8%,路网更新时间降低了3个数量级。DkNN算法可以快速响应动态路网中的kNN查询请求,且在处理路网更新时具有较低的更新成本。

    个性化多层兴趣提取点击率预测模型
    仇丽青, 苏小盼
    2024, 44(11):  3411-3418.  DOI: 10.11772/j.issn.1001-9081.2023111681
    摘要 ( )   HTML ( )   PDF (702KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前,点击率(CTR)预测最常用的方法是利用特征交互技术提取兴趣特征,但这些方法大多忽视了用户与项目之间的内在联系,同时也未能充分发掘项目间所蕴含的用户潜在兴趣。针对该问题,提出一种个性化多层兴趣提取点击率预测模型(PMIC),旨在从不同角度深入挖掘用户在同一时间内展现的多层兴趣。首先,采用召回匹配的方法,从项目学习模块和用户学习模块两个角度学习并建模用户与项目之间的联系,捕捉用户多样化的兴趣;其次,利用多头自注意力机制,在项目学习模块中提取同一时间内隐含的多个潜在兴趣;最后,通过内积计算,进一步细化和加强用户与项目之间的特征表达。在多个公共数据集上的实验结果表明,与基线模型相比,PMIC的受试者特征工作曲线下面积(AUC)最少提高了2.3%。

    基于多域特征提取的多变量时间序列异常检测
    赵培, 乔焰, 胡荣耀, 袁新宇, 李敏悦, 张本初
    2024, 44(11):  3419-3426.  DOI: 10.11772/j.issn.1001-9081.2023111636
    摘要 ( )   HTML ( )   PDF (754KB) ( )   PDF(mobile) (1807KB) ( 23 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    多变量时间序列(MTS)数据具有高维性,且分布复杂多变,现有的异常检测模型在面对MTS数据集时普遍存在误判率高、训练困难等问题,且多数模型仅考虑时间序列样本的时空特征,对时间序列特征的学习并不全面。为了解决以上问题,提出一种基于多域特征提取的MTS异常检测模型(MFE-TS)。首先,从原始数据域出发,使用长短期记忆(LSTM)网络与卷积神经网络(CNN)分别提取MTS的时间相关性和空间相关性特征。其次,用傅里叶变换将原始时间序列转换到频域空间,并利用Transformer学习数据在频域空间的幅度与相位特征。多域特征学习能更全面地建模时间序列特征,从而提高模型对MTS的异常检测性能。此外,引入掩码策略,进一步增强模型的特征学习能力,并使模型具备一定的抗噪性。实验结果表明,MFE-TS在多个真实MTS数据集上展现了优越的性能,同时在含有噪声的数据集中仍能保持较好的检测效果。

    基于多尺度门控膨胀卷积网络的时间序列预测算法
    曾渝, 张洋, 曾尚, 付茂栗, 何启学, 曾林隆
    2024, 44(11):  3427-3434.  DOI: 10.11772/j.issn.1001-9081.2023111583
    摘要 ( )   HTML ( )   PDF (803KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对当前时间序列预测任务存在的高维特征、大规模数据以及对预测准确性高要求等问题,提出一种基于多尺度趋势-周期分解的多头门控膨胀卷积网络模型。该模型采用多尺度分解方法,将原始协变量序列和预测变量序列分解为各自的周期项和趋势项,从而实现独立的预测。对于周期项,引入多头门控膨胀卷积网络的编码器,以提取各自的周期信息;在解码器阶段,使用交叉注意力机制进行通道信息的交互融合,并将预测变量的周期信息采样对齐后通过时间注意力与通道融合信息进行周期预测。对趋势项则采用自回归方式进行趋势预测。最后将趋势预测与周期预测的结果相加得到预测序列。与长短期记忆(LSTM)、Informer等多个主流基准模型进行比较,所提模型在ETTm1、ETTh1等5个数据集上的均方误差(MSE)平均下降了19.2%~52.8%,平均绝对误差(MAE)平均下降了12.1%~33.8%。通过消融实验验证了所提出的多尺度分解模块、多头门控膨胀卷积以及时间注意力模块能提升时序预测的准确度。

    基于多尺度特征融合的时间序列长期预测模型
    刘文博, 于连飞, 谢冬梅, 蔡闯, 曲志坚, 任崇广
    2024, 44(11):  3435-3441.  DOI: 10.11772/j.issn.1001-9081.2023111705
    摘要 ( )   HTML ( )   PDF (1095KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    长期时间序列预测在多个领域中具有广泛的应用需求。但是,时间序列的长期预测过程中表现出的非平稳性问题是影响预测准确性的关键因素。为了提高时间序列长期预测精度,以及预测模型的普适性,构建了基于序列分解的多尺度融合注意力神经网络预测网络(MSDFAN)模型。该模型采用时间序列分解提取输入数据中的季节成分和趋势成分,对不同数据成分进行不同的预测建模,能够对具有多尺度稳定特征的非平稳时间成分进行建模和预测。实验结果表明,与FEDformer相比,MSDFAN在5个基准数据集上的预测结果的均方误差(MSE)和平均绝对误差(MAE)分别平均下降了12.95%和8.49%,MSDFAN模型在多变量时间序列上取得了更好的预测精度。

    基于分解和频域特征提取的多变量长时间序列预测模型
    范艺扬, 张洋, 曾尚, 曾渝, 付茂栗
    2024, 44(11):  3442-3448.  DOI: 10.11772/j.issn.1001-9081.2023111684
    摘要 ( )   HTML ( )   PDF (753KB) ( )   PDF(mobile) (1302KB) ( 18 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有基于Transformer的多变量长时间序列预测(MLTSF)模型主要从时域中提取特征,难以直接从长时间序列分散的时间点中找出可靠依赖关系的问题,提出一种新的基于分解和频域特征提取的模型。首先,提出基于频域的周期项-趋势项的分解方法,以降低分解过程的时间复杂度;其次,在利用周期项-趋势项分解提取序列趋势性特征的基础上,利用基于Gabor变换进行频域特征提取的Transformer网络捕捉周期性的依赖,提高预测的稳定性和鲁棒性。在5个基准数据集上的实验结果显示,与现有的先进方法相比,所提模型在MLTSF上的均方误差(MSE)平均减小了7.6%,最多减小了18.9%,有效提升了预测精度。

    基于基因关联分析的贝叶斯网络疾病样本分类算法
    李志杰, 廖旭红, 李元香, 李青蓝
    2024, 44(11):  3449-3458.  DOI: 10.11772/j.issn.1001-9081.2024030398
    摘要 ( )   HTML ( )   PDF (644KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基因表达数据作为生物学中一种特定类型的大数据,尽管基因表达值都是普通的实数值,但它们的相似性不是基于欧氏距离度量,而是基于基因表达值是否展现同升同降趋势。目前的基因贝叶斯网络以基因表达水平值为节点随机变量,没有体现这种子空间模式的相似性。因此,提出基于基因关联分析的贝叶斯网络疾病分类算法(BCGA),从带类标签的疾病样本-基因表达数据中学习贝叶斯网络并预测新疾病样本的分类。首先,将疾病样本离散化过滤以选择基因,并将降维后的基因表达值排序和置换为基因列下标;其次,分解基因列下标序列为长度为2的原子序列集合,而这个集合的频繁原子序列对应一对基因的关联关系;最后,通过基因关联熵度量因果关系,并用于贝叶斯网络结构学习。BCGA的参数学习也变得很容易,基因节点的条件概率分布只要统计该基因的原子序列和父节点基因的原子序列出现频次即可。在多个肿瘤和非肿瘤基因表达数据集上的实验结果表明,相较于已有的同类算法,BCGA的疾病分类准确率明显提高,分析时间有效缩短;另外,BCGA使用基因关联熵代替条件独立性,使用基因原子序列代替基因表达值,可以更好地拟合基因表达数据。

    网络空间安全
    面向联邦学习的后门攻击与防御综述
    陈学斌, 屈昌盛
    2024, 44(11):  3459-3469.  DOI: 10.11772/j.issn.1001-9081.2023111653
    摘要 ( )   HTML ( )   PDF (785KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    联邦学习(FL)作为一种分布式的机器学习方法,允许不同参与方利用各自的本地数据集合作训练一个机器模型,因此能够解决数据孤岛与用户隐私保护问题。但是,FL本身的分布式特性使它更容易受到后门攻击,这为它的实际应用带来了更大的挑战。因此,深入了解FL环境下的后门攻击与防御方法对该领域的发展至关重要。首先,介绍了FL的定义、流程和分类以及后门攻击的定义;其次,从FL环境下的后门攻击和后门防御方案这两个方面进行了详细介绍与分析,并对后门攻击和后门防御方法进行对比;最后,对FL环境下的后门攻击与防御方法的发展进行了展望。

    DevSecOps中软件安全性测试技术综述
    刘羿希, 何俊, 吴波, 刘丙童, 李子玉
    2024, 44(11):  3470-3478.  DOI: 10.11772/j.issn.1001-9081.2023101531
    摘要 ( )   HTML ( )   PDF (616KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    软件安全性测试技术是互联网时代软件开发商完善软件性能和抵御网络攻击的重要手段,而将安全性(Security)融入开发(Development)和运维(Operations)过程中的理念DevSecOps作为新一代软件开发模式,能够识别软件可能存在的威胁和有效评估软件安全性,可将软件安全风险置于可控范围内。于是,以DevOps(Development and Operations)流程为研究起点,梳理DevOps软件开发模式各阶段涉及的软件安全性测试技术,包括源代码审计、模糊测试、漏洞扫描、渗透测试和安全众测技术;收集和分析SCI、EI、SCOPUS、CNKI、CSCD和万方等知名索引库中近三年的相关文献资料,归纳总结以上技术的研究现状,并给出相关测试工具的使用建议;同时针对各技术支撑手段的优缺点,对软件开发模式DevSecOps的未来发展方向进行了展望。

    基于脆弱指纹的深度神经网络模型完整性验证框架
    林翔, 金彪, 尤玮婧, 姚志强, 熊金波
    2024, 44(11):  3479-3486.  DOI: 10.11772/j.issn.1001-9081.2023101518
    摘要 ( )   HTML ( )   PDF (1197KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    预训练模型容易受到外部敌手实施的模型微调和模型剪枝等攻击,导致它的完整性被破坏。针对这一问题,提出一种针对黑盒模型的脆弱指纹框架FFWAS (Fragile Fingerprint With Adversarial Samples)。首先,提出一种无先验知识的模型复制框架,而FFWAS为每一位用户创建独立的模型副本;其次,利用黑盒方法在模型边界放置脆弱指纹触发集,若模型发生修改,边界发生变化,触发集将被错误分类;最后,用户借助模型副本上的脆弱指纹触发集对模型的完整性进行验证,若触发集的识别率低于预设阈值,则意味着模型完整性已被破坏。基于2种公开数据集MNIST和CIFAR-10对FFWAS的有效性和脆弱性进行实验分析,结果表明,在模型微调和剪枝攻击下,FFWAS的指纹识别率相较于完整模型均明显下降并低于设定阈值;与基于模型唯一性和脆弱签名的深度神经网络认证框架(DeepAuth)相比,FFWAS的触发集与原始样本在2个数据集上的相似性分别提高了约22%和16%,表明FFWAS具有更好的隐蔽性。

    基于半监督联邦学习的恶意流量检测模型
    张帅华, 张淑芬, 周明川, 徐超, 陈学斌
    2024, 44(11):  3487-3494.  DOI: 10.11772/j.issn.1001-9081.2023101500
    摘要 ( )   HTML ( )   PDF (748KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    恶意流量检测是应对网络安全挑战的关键技术之一。针对采用联邦学习进行恶意流量检测时,本地标记数据不足,非独立同分布(non-IID)导致协同训练模型性能下降的问题,构建一种基于半监督联邦学习的恶意流量检测模型。该模型借助伪标记和一致性正则化项的半监督学习技术,有效地从未标记数据中提取信息进行训练;同时,设计一种非线性函数,用于动态调整客户端本地有监督和无监督损失在聚合时的权重,以充分利用未标记数据,提高模型的准确性。为降低non-IID问题对全局模型性能的影响,提出一种联邦聚合算法FedLD (Federated-Loss-Data),通过结合训练损失和数据量的权重计算方法,自适应地调整全局模型聚合过程中各客户端模型的权重。实验结果表明,在NSL-KDD数据集上,所提模型在标记数据有限的情况下能够实现较高的检测准确率,与基线模型FedSem (Federated Semi-supervised)相比,检测准确率提升了4.11个百分点,在正常流量(Normal)、拒绝服务(DoS)攻击和探测(Probe)等类别上的召回率也提升了1.65~7.66个百分点,说明所提模型更适用于恶意流量检测领域。

    支持密码逆向防火墙的基于SM9的属性基可搜索加密方案
    高改梅, 段明博, 荀亚玲, 刘春霞, 党伟超
    2024, 44(11):  3495-3502.  DOI: 10.11772/j.issn.1001-9081.2023111678
    摘要 ( )   HTML ( )   PDF (951KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对属性基可搜索加密(ABSE)方案大都基于非国密算法设计,且无法抵抗内部算法替换攻击(ASA)的问题,提出一种支持密码逆向防火墙的基于SM9的属性基可搜索加密方案(SM9ABSE-CRF)。该方案将国密算法SM9扩展至ABSE领域,实现了细粒度数据访问控制,并引入密码逆向防火墙(CRF)技术有效抵御ASA。分析了SM9ABSE-CRF在判定性Diffie-Hellman(DBDH)假设下满足了选择关键词下的不可区分性,并形式化证明了CRF的部署满足维持功能性、保留安全性以及抵抗泄漏性。理论分析和仿真实验结果表明,与提供CRF的ABSE方案cABKS-CRF (consistent Attribute-Based Keyword Search system with CRF)相比,SM9ABSE-CRF具有更高的安全性,并且在索引与陷门生成阶段也表现出显著的性能优势。

    先进计算
    可满足性问题相变研究综述
    彭庆媛, 王晓峰, 王军霞, 华盈盈, 唐傲, 何飞
    2024, 44(11):  3503-3512.  DOI: 10.11772/j.issn.1001-9081.2023111559
    摘要 ( )   HTML ( )   PDF (739KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    约束满足问题(CSP)是理论计算机科学领域的组合优化问题,可满足性问题(SAT问题)作为CSP中的一种特殊情形,是理论计算机科学、数理逻辑和人工智能等领域十分关注的热点问题。相变是SAT问题中存在的一种现象,而研究SAT问题的相变现象和相变机制对深入认识SAT问题的难解本质和一般数学现象以及设计更高效的算法求解SAT问题有重要的指导意义。因此,根据近年来国内外学者针对SAT问题的相变现象取得的一些重要研究成果,首先介绍了SAT问题相变的相关知识以及SAT问题的概率分析方法和实例生成模型,其次总结并分析了SAT问题的不可满足相变和可满足相变这两种相变的相变点求解方法和相变阈值,最后展望了SAT问题相变的研究趋势。

    考虑设施规模决策的两级选址-路径优化
    冷琴, 毛政元
    2024, 44(11):  3513-3520.  DOI: 10.11772/j.issn.1001-9081.2023101515
    摘要 ( )   HTML ( )   PDF (777KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目前电商行业基础设施布局和空间利用不合理的问题,提出考虑设施规模决策的两级选址-路径问题(2E-LRP)求解模型。首先,在传统2E-LRP中引入差异性设施规模约束,通过识别客户群设计不同设施规模组合,利用规模弹性变化调整总成本组成,并以最小运营成本为目标建立顾及设施规模弹性变化的2E-LRP模型;其次,提出两阶段混合迭代局部搜索启发式算法求解模型;最后,分析所提模型和优化算法,并以Prodhon等不同数据集为实例进行验证。实验结果表明,所提模型具有针对区域差异和不同数据规模的普适性,且设施规模的弹性变化范围值与总成本呈负相关;与拉格朗日松弛粒度禁忌搜索(LRGTS)等算法的最优成本相比,所提算法对所有算例的最优成本平均值降低了6.67%,可以有效节约运行成本。

    基于GPU对角稀疏矩阵向量乘法的动态划分算法
    涂进兴, 李志雄, 黄建强
    2024, 44(11):  3521-3529.  DOI: 10.11772/j.issn.1001-9081.2023101524
    摘要 ( )   HTML ( )   PDF (1105KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在图形处理器(GPU)上实现对角稀疏矩阵向量乘法(SpMV)可以充分利用GPU的并行计算能力,并加速矩阵向量乘法;然而,相关主流算法存在零元填充数据多、计算效率低的问题。针对上述问题,提出一种对角SpMV算法DIA-Dynamic(DIAgonal-Dynamic)。首先,设计一种全新的动态划分策略,根据矩阵的不同特征进行分块,在保证GPU高计算效率的同时大幅减少零元填充,去除冗余计算量;其次,提出一种对角稀疏矩阵存储格式BDIA(Block DIAgonal)存储分块数据,并调整数据布局,提高GPU上的访存性能;最后,基于GPU的底层进行条件分支优化,以减少分支判断,并使用动态共享内存解决向量的不规则访问问题。DIA-Dynamic与前沿Tile SpMV算法相比,平均加速比达到了1.88;与前沿BRCSD (Diagonal Compressed Storage based on Row-Blocks)-Ⅱ算法相比,平均零元填充减少了43%,平均加速比达到了1.70。实验结果表明,DIA-Dynamic能够有效提高GPU上对角SpMV的计算效率,缩短计算时间,提升程序性能。

    高效的自适应复杂网络鲁棒性优化算法
    黄杰, 武瑞梓, 李均利
    2024, 44(11):  3530-3539.  DOI: 10.11772/j.issn.1001-9081.2023111659
    摘要 ( )   HTML ( )   PDF (1046KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    提升复杂网络的鲁棒性对于网络抵御外部攻击和级联失效具有重要现实意义。现有进化算法在解决网络结构优化问题时存在局限,特别是在收敛性和优化速度方面有待提升。针对这一问题,提出一种新的自适应复杂网络鲁棒性优化算法SU-ANet (SUrrogate-assisted and Adaptive Network optimization algorithm)。为降低鲁棒性计算所带来的巨大时间开销,该算法构建了基于注意力机制的鲁棒性预测器作为离线代理模型,以代替局部搜索算子中频繁的鲁棒性计算;而在进化过程中,为避免陷入局部最优,同时拓宽解空间的搜索范围,算法全面考虑了全局和局部信息;另外,通过设计交叉算子,使每个个体与全局最优候选解和随机个体进行连边互换,以平衡算法的收敛性和多样性;此外,采用参数自适应机制自动调整算子的执行概率,以减少参数设计对算法性能带来的不确定性影响。在人工合成网络和真实网络上的实验结果表明,SU-ANet具有更好的搜索能力和更高的进化效率。

    网络与通信
    改进TCP/IP帧结构的多参数信道传输性能评估方法
    贺锋涛, 王炳辉, 张斌, 杨祎, 封一博
    2024, 44(11):  3540-3547.  DOI: 10.11772/j.issn.1001-9081.2023111638
    摘要 ( )   HTML ( )   PDF (1273KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前,网络密集化现象加剧了信道传输性能的恶化。而普遍应用的评估方法由于参数考虑有限和适用范围受限,在信道传输性能评估方面面临显著挑战。针对信道传输性能评估困难的问题,提出一种改进传输控制协议/网际协议(TCP/IP)帧结构的多参数信道传输性能评估方法。首先,生成标准化的测试数据,包括伪随机码、基本曲线数据、自定义曲线数据,以确保测试数据遵循统一标准;其次,使用改进的TCP/IP帧结构,将总帧数、帧序号等测试数据信息封装在TCP/IP帧中,并对测试数据进行收发与解析,统计不同帧类型的帧数量、不同帧长度的帧数量、总帧数和有效数据量这4种基础信道传输信息;最后,分析接收数据得到误帧率和误码率这2种高级信道传输信息,完成信道传输性能的整体评估。所设计的方法采用6种不同的参数对信道质量进行评估,方法评估的精度可达0.01%,最小误差为0.01%,且兼容所有使用TCP/IP进行通信的信道。实验结果表明,所提出的信道传输性能评估方法可以完成对6种信道通信信息的统计与分析,准确评估信道传输性能。

    多媒体计算与计算机仿真
    基于3D几何特征深度表达学习的物理系统仿真
    林滏, 石稼晟, 高泽, 楚遵康, 马琼敏, 余海燕, 饶卫雄
    2024, 44(11):  3548-3555.  DOI: 10.11772/j.issn.1001-9081.2023101505
    摘要 ( )   HTML ( )   PDF (2170KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有深度学习方法在物理系统仿真中无法处理几何边界与初始条件同时变化的场景的问题,提出将几何边界约束的表达与物理系统仿真解耦的技术思路,设计了几何特征表达学习和物理系统仿真双步骤的技术路线。在构建与外部物理条件无关的几何特征提取模块之后,融合提取的几何特征与物理特征,最后设计基于神经网络的物理系统仿真方法。在应力场预测实验中,所提方法的预测时间为2.63 ms,远低于有限元法(FEM)的0.6 s,且平均绝对误差(MAE)仅为MeshNet的0.389倍。实验结果表明,所提方法能够保持较高仿真精度,同时能够较好地适应不同的几何边界与初始条件。

    基于四叉树先验辅助的多视图立体方法
    胡立华, 李小平, 胡建华, 张素兰
    2024, 44(11):  3556-3564.  DOI: 10.11772/j.issn.1001-9081.2023111661
    摘要 ( )   HTML ( )   PDF (6054KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于PatchMatch的多视图立体(MVS)方法依据输入多幅图像估计场景的深度,目前已应用于大规模场景三维重建。然而,由于特征匹配不稳定、仅依赖光度一致性不可靠等原因,现有方法在弱纹理区域的深度估计准确性和完整性较低。针对上述问题,提出一种基于四叉树先验辅助的MVS方法。首先,利用图像像素值获得局部纹理;其次,基于自适应棋盘网格采样的块匹配多视图立体视觉方法(ACMH)获得粗略的深度图,结合弱纹理区域中的结构信息,采用四叉树分割生成先验平面假设;再次,融合上述信息,设计一种新的多视图匹配代价函数,引导弱纹理区域得到最优深度假设,进而提高立体匹配的准确性;最后,在ETH3D、Tanks and Temples和中国科学院古建筑数据集上与多种现有的传统MVS方法进行对比实验。结果表明所提方法性能更优,特别是在ETH3D测试数据集中,当误差阈值为2 cm时,相较于当前先进的多尺度平面先验辅助方法(ACMMP),它的F1分数和完整性分别提高了1.29和2.38个百分点。

    四向加权香农熵最大化导向的自动阈值分割方法
    邹耀斌, 张彬
    2024, 44(11):  3565-3573.  DOI: 10.11772/j.issn.1001-9081.2023111639
    摘要 ( )   HTML ( )   PDF (1458KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    灰度图像的灰度直方图可以呈现出无峰、单峰、双峰或多峰的形态特征,但传统熵阈值分割方法大多仅适合处理具有单峰或双峰形态特征的灰度图像。为了提高熵阈值分割方法的分割精度和分割适应性,提出一种四向加权香农熵最大化导向的自动阈值分割方法FWSE(Four-directional Weighted Shannon Entropy)。首先用新设计的方向性Prewitt卷积核在4个方向进行多尺度乘积变换(MPT),以获得一系列方向性MPT图像;再基于三次样条插值函数和曲率最大化准则自动计算出每个方向的最优MPT图像;其次在每个方向上通过内外轮廓图像对最优MPT图像的像素进行重新取样,以获取重构的灰度直方图,并在此基础上计算相应的香农熵;最后以4个方向的加权香农熵最大化为准则选取最佳分割阈值。与新近的3种阈值分割方法以及2种非阈值分割方法在4幅合成图像和100幅真实世界图像上进行实验,结果显示:在合成图像上,FWSE方法的平均马修斯相关系数(MCC)达到了0.999;在真实世界图像上,FWSE方法与其他5个分割方法的平均MCC分别是0.974、0.927、0.668、0.595、0.550和0.525。这表明FWSE方法具有更高的分割精度和更灵活的分割适应性。

    基于扩散模型微调的高保真图像编辑
    刘雨生, 肖学中
    2024, 44(11):  3574-3580.  DOI: 10.11772/j.issn.1001-9081.2023111570
    摘要 ( )   HTML ( )   PDF (2101KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目前主流的图像编辑方法存在任务单一、操作不友好、保真度低等问题,提出一种基于扩散模型对图像进行高保真编辑的方法。该方法将目前主流的稳定扩散模型作为骨干网络,首先使用低秩适用(LoRA)方法对模型进行微调,使模型能够更好地重建原始图像;其次,使用微调后的模型将图片与简单的提示词通过设计的框架进行推理,最终生成编辑后图像。另外,在上述方法基础上扩展提出了双层U-Net结构用于特定需求的图像编辑任务以及视频合成。与领先的方法Imagic、DiffEdit、InstructPix2Pix在Tedbench数据集上的对比实验结果显示:所提方法能够对图像进行包括非刚性编辑的多种编辑任务,可编辑性强;而且在学习感知块相似性(LPIPS)指数上比Imagic下降了30.38%,表明该方法具有更高的保真度。

    基于模糊多尺度特征的遥感图像分割网络
    李子怡, 曲婷婷, 崇乾鹏, 徐金东
    2024, 44(11):  3581-3586.  DOI: 10.11772/j.issn.1001-9081.2023101540
    摘要 ( )   HTML ( )   PDF (1521KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    受成像距离、光照、地物特征、环境等因素影响,遥感图像中同一类别物体可能存在一定差异,而不同类别的物体反而显示相似的视觉特征,这导致在分割时存在着不确定性,即类内异质与类间模糊。为了解决此问题,提出一种用于遥感图像分割的模糊多尺度卷积神经网络(FMCNet)。该网络通过提取图像中不同尺度、大小和宽高比的感受野,充分表征遥感物体的细节信息,并利用模糊逻辑有效地表达像素与其相邻像素之间的关系,进而解决遥感图像分割中的不确定性问题。实验结果表明,FMCNet在ISPR Vaihingen和Potsdam数据集上的整体准确率(OA)分别为85.3%和86.3%,优于现有流行的语义分割方法。

    基于多尺度记忆库的像素级无监督工业异常检测
    刘永江, 陈斌
    2024, 44(11):  3587-3594.  DOI: 10.11772/j.issn.1001-9081.2023111690
    摘要 ( )   HTML ( )   PDF (1125KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于特征嵌入的无监督异常检测方法通常使用patch级特征定位异常。patch级特征在图像级异常检测任务上具有竞争力,但在像素级定位方面存在精度不足的问题。为解决这一问题,提出一种由多尺度记忆库与分割网络组成的像素级异常检测方法MemAD。首先,通过预训练的特征提取网络对训练集中的正常样本进行特征提取,构建3个尺度下的正样本特征记忆库;其次,在训练分割网络时,计算模拟的伪异常样本特征与记忆库中距离最近的正样本特征的差特征,进一步引导分割网络学习如何定位异常像素。实验结果表明,MemAD在MVTec AD (MVTec Anomaly Detection)数据集上的图像级和像素级接受者操作特征曲线下面积(AUC)分别达到了98.0%和97.4%,优于大多数的现有方法,验证了它在像素级异常定位中的准确性。

    基于空洞卷积融合Transformer的无人机图像小目标检测方法
    王林, 刘景亮, 王无为
    2024, 44(11):  3595-3602.  DOI: 10.11772/j.issn.1001-9081.2023111575
    摘要 ( )   HTML ( )   PDF (1433KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对无人机(UAV)航拍图像中目标场景复杂、目标尺度多样、小目标密集和目标遮挡严重的问题,提出一种多尺度空洞卷积的UAV图像目标检测算法Swin-Det。首先,采用Swin Transformer作为主干特征提取网络,并在主干网络中引入空间信息交融模块(SIBM),从而解决因物体间遮挡而导致的目标信息模糊的问题;其次,提出一种融合空洞特征金字塔网络(FDFPN),通过多分支的空洞卷积融合特征信息,以有效提高网络的感受野以及特征信息的复用,使模型可以学习到不同维度的细节特征;最后,采用线性插值法和多任务损失函数解决预测区域不匹配和样本不平衡的问题,提升模型的检测精度。在VisDrone数据集上的实验结果表明,Swin-Det算法的平均精度均值(mAP)达到了27.2%,与原始Swin Transformer相比,提高了4.1个百分点,且在同一训练批次下收敛更快。可见,Swin-Det算法可在复杂场景下实现对无人机图像目标的高精度检测。

    基于改进YOLOv8n的无人机视角下小目标检测算法
    刘涛, 鞠事宏, 高一萌
    2024, 44(11):  3603-3609.  DOI: 10.11772/j.issn.1001-9081.2023111644
    摘要 ( )   HTML ( )   PDF (1561KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目标检测算法在无人机视角下的小目标检测中精度低的问题,通过改进YOLOv8的骨干网络与注意力机制,提出一种新的小目标检测算法SFM-YOLOv8。首先,在骨干网络中融入适用于低分辨率图像和小物体检测的空间深度转换卷积(SPDConv),保留判别特征信息,提高小目标感知能力;其次,插入多分支注意力MCA(Multiple Coordinate Attention),加强提取特征层的空间信息和通道信息;然后,构建一种融合FasterNet和高效多尺度注意力(EMA)的卷积FE-C2f,减少计算量并使模型轻量化;此外,引入边界框相似度比较度量(MPDIoU)损失函数提高算法精度;最后,在YOLOv8n的网络结构中增加小目标检测层,保留更多关于小目标的位置信息和细节特征。实验结果表明,与YOLOv8n相比,SFM-YOLOv8算法在VisDrone-DET2019数据集上的平均精度均值mAP50提高了4.37个百分点,参数量减少了5.98%;与相关主流模型对比,精度也有所提升,且满足实时检测需求。

    基于改进YOLOv8的水下目标检测算法
    李大海, 李冰涛, 王振东
    2024, 44(11):  3610-3616.  DOI: 10.11772/j.issn.1001-9081.2023111550
    摘要 ( )   HTML ( )   PDF (1637KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    由于水下生物的特性,水下图像中存在较多难以检测的小目标,且目标之间经常相互遮挡,而水下环境中的光线吸收和散射也会造成水下图像的颜色偏移和模糊。针对上述问题,提出水下目标检测算法WCA-YOLOv8。首先,设计特征融合模块(FFM),增强对空间维度信息的关注,提升对模糊和颜色偏移目标的识别能力;其次,加入FCA(FReLU Coordinate Attention)模块,增强对相互重叠、遮挡水下目标的特征提取能力;再次,为了提高模型对水下小目标的检测性能,将完整交并比(CIoU)损失函数替换为WIoU v3(Wise-IoU version 3)损失函数;最后,设计下采样增强模块(DEM),使特征提取过程中保存的上下文信息更完整,改善水下目标检测的性能。RUOD和URPC数据集上的实验结果表明,WCA-YOLOv8的检测平均精度均值(mAP0.5)分别为75.8%和88.6%,检测速度分别为60 frame/s和57 frame/s。与其他前沿的水下物体检测算法相比,WCA-YOLOv8不仅能够获得更高的检测准确性,还可达到更快的检测速度。

    基于上下文感知网络的息肉分割算法
    顾聪, 段其强, 任思雨
    2024, 44(11):  3617-3622.  DOI: 10.11772/j.issn.1001-9081.2023111650
    摘要 ( )   HTML ( )   PDF (838KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于深度学习的方法进行息肉图像分割时会面临以下问题:不同医疗设备采集的图像在特征分布上存在差异,导致不同的息肉分割数据集之间存在域偏移;现有模型大多专注于处理相同尺度大小的特征,对不同尺度息肉的捕捉能力存在一定的限制;息肉与周围组织的视觉特征和颜色差异通常较小,导致模型难以准确地区分息肉与背景。为了解决这些问题,提出以金字塔结构的视觉Transformer(PVT)为主体的上下文感知网络(CANet),主要包括以下模块:1)域自适应去噪模块(DADM),对低级特征图采用通道注意力以及空间注意力以解决不同域图像之间的域偏移以及噪声问题;2)尺度校准模块(SRM),处理编码器提取的多尺度特征,解决息肉大小和形状明显变化的问题;3)迭代式语义嵌入模块(ISEM),减少背景干扰,提高对目标边界的感知能力,提升息肉分割的准确性。在5个公开的结肠息肉数据集上的实验结果表明,CANet比当前广泛采用的结肠息肉分割方法取得了更好的结果,在Kvasir-SEG和CVC-ClinicDB数据集上的mDice(mean Dice)分别为92.6%和94.0%。

    前沿与综合应用
    基于轨迹预测和分布式MADDPG的无人机集群追击决策
    王昱, 关智慧, 李远鹏
    2024, 44(11):  3623-3628.  DOI: 10.11772/j.issn.1001-9081.2023101538
    摘要 ( )   HTML ( )   PDF (918KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对复杂任务环境下无人机(UAV)集群追击决策算法灵活性不足、泛化能力差等问题,提出一种基于轨迹预测的分布式多智能体深度确定性策略梯度(TP-DMADDPG)算法。首先,为增强追击任务的真实性,为目标机设计智能化逃逸策略;其次,考虑到因通信中断等原因导致的目标机信息缺失等情况,采用长短时记忆(LSTM)网络实时预测目标机的位置信息,并基于预测信息构建决策模型的状态空间;最后,依据分布式框架和多智能体深度确定性策略梯度(MADDPG)算法设计TP-DMADDPG算法,增强复杂空战进程中集群追击决策的灵活性和泛化能力。仿真实验结果表明,相较于深度确定性策略梯度(DDPG)、双延迟深度确定性策略梯度(TD3)和MADDPG算法,TP?DMADDPG算法将协同决策的成功率提升了至少15个百分点,能够解决不完备信息下追击智能化逃逸目标机的问题。

    基于裁剪近端策略优化算法的软机械臂不规则物体抓取
    余家宸, 杨晔
    2024, 44(11):  3629-3638.  DOI: 10.11772/j.issn.1001-9081.2023111712
    摘要 ( )   HTML ( )   PDF (3923KB) ( )   PDF(mobile) (1849KB) ( 18 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为应对传统深度强化学习(DRL)算法在处理复杂场景,特别是在不规则物体抓取和软体机械臂应用中算法稳定性和学习率较差的问题,提出一种基于裁剪近端策略优化(CPPO)算法的软体机械臂控制策略。通过引入裁剪函数,该算法优化了近端策略优化(PPO)算法的性能,提升了它在高维状态空间的稳定性和学习效率。首先定义了软体机械臂的状态空间和动作空间,并设计了模仿八爪鱼触手的软体机械臂模型;其次利用Matlab的SoRoSim (Soft Robot Simulation)工具箱进行建模,同时定义了结合连续和稀疏函数的环境奖励函数;最后构建了基于Matlab的仿真平台,通过Python脚本和滤波器对不规则物体图像进行预处理,并利用Redis缓存高效传输处理后的轮廓数据至仿真平台。与TRPO (Trust Region Policy Optimization)和SAC (Soft Actor-Critic)算法的对比实验结果表明,CPPO算法在软体机械臂抓取不规则物体任务中达到了86.3%的成功率,比TRPO算法高出了3.6个百分点。这说明CPPO算法可以应用于软体机械臂控制,可在非结构化环境下为软体机械臂在复杂抓取任务中的应用提供重要参考。

    基于RPEpose和XJ-GCN的轻量级跌倒检测算法框架
    梁睿衍, 杨慧
    2024, 44(11):  3639-3646.  DOI: 10.11772/j.issn.1001-9081.2023101379
    摘要 ( )   HTML ( )   PDF (1283KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传统的以ViT(Vision Transformer)模型为基准架构的关节点检测模型通常采用二维正弦位置编码,易丢失图像关键的二维形状信息,导致精度下降;而行为分类模型中,传统的时空图卷积网络(ST-GCN)在单标签分区策略中存在非物理连接的关节连接间关联度缺失问题。针对上述问题,设计一种轻量化实时跌倒检测算法框架,以快速准确地检测跌倒行为。该框架包含关节点检测模型RPEpose(Relative Position Encoding pose estimation)和行为分类模型XJ-GCN(Cross-Joint attention Graph Convolutional Network)。一方面,RPEpose模型采用相对位置编码克服原有位置编码的位置不敏感的缺陷,提升ViT架构在关节点检测中的性能;另一方面,提出X-Joint(Cross?Joint)注意力机制,将分区策略重构为XJL(X-Joint Labeling)分区策略后,对所有关节连接之间的依赖关系建模,能获得关节连接潜在相关性,具有分类性能优异且参数量小的优势。实验结果表明,在COCO 2017验证集上,对于分辨率为256×192的图像,RPEpose模型的计算开销仅为8.2 GFLOPs(Giga FLOating Point of operations),测试平均精度(AP)为74.3%;在以交叉目标(X?Sub)为划分标准的NTU RGB+D数据集上,XJ-GCN模型的测试Top-1准确率为89.6%,所提框架RPEpose+XJ-GCN的处理速度为30 frame/s,预测准确率为87.2%,具有较高的实时性和准确性。

2025年 45卷 4期
刊出日期: 2025-04-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会