当期目录

    2024年 第44卷 第7期 刊出日期:2024-07-10
    人工智能
    基于低秩分解和向量量化的深度网络压缩方法
    王东炜, 刘柏辰, 韩志, 王艳美, 唐延东
    2024, 44(7):  1987-1994.  DOI: 10.11772/j.issn.1001-9081.2023071027
    摘要 ( )   HTML ( )   PDF (1506KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着人工智能的发展,深度神经网络成为多种模式识别任务中必不可少的工具,由于深度卷积神经网络(CNN)参数量巨大、计算复杂度高,将它部署到计算资源和存储空间受限的边缘计算设备上成为一项挑战。因此,深度网络压缩成为近年来的研究热点。低秩分解与向量量化是深度网络压缩中重要的两个研究分支,其核心思想都是通过找到原网络结构的一种紧凑型表达,从而降低网络参数的冗余程度。通过建立联合压缩框架,提出一种基于低秩分解和向量量化的深度网络压缩方法——可量化的张量分解(QTD)。该方法能够在网络低秩结构的基础上实现进一步的量化,从而得到更大的压缩比。在CIFAR-10数据集上对经典ResNet和该方法进行验证的实验结果表明,QTD能够在准确率仅损失1.71个百分点的情况下,将网络参数量压缩至原来的1%。而在大型数据集ImageNet上把所提方法与基于量化的方法PQF (Permute, Quantize, and Fine-tune)、基于低秩分解的方法TDNR (Tucker Decomposition with Nonlinear Response)和基于剪枝的方法CLIP-Q (Compression Learning by In-parallel Pruning-Quantization)进行比较与分析的实验结果表明,QTD能够在相同压缩范围下实现更好的分类准确率。

    统一框架的增强深度子空间聚类方法
    王清, 赵杰煜, 叶绪伦, 王弄潇
    2024, 44(7):  1995-2003.  DOI: 10.11772/j.issn.1001-9081.2023101395
    摘要 ( )   HTML ( )   PDF (3432KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    深度子空间聚类是一种处理高维数据聚类任务的有效方法。然而,现有的深度子空间聚类方法通常将自表示学习和指标学习作为两个独立的过程,导致在处理具有挑战性的数据时,固定的自表示矩阵会导致次优的聚类结果;另外,自表示矩阵的质量对聚类结果的准确性至关重要。针对上述问题,提出一种统一框架的增强深度子空间聚类方法。首先,通过将特征学习、自表示学习和指标学习集成在一起同时优化所有参数,根据数据的特征动态地学习自表示矩阵,确保准确地捕捉数据特征;其次,为了提高自表示学习的效果,提出类原型伪标签学习,为特征学习和指标学习提供自监督信息,进而促进自表示学习;最后,为了增强嵌入表示的判别能力,引入正交性约束帮助实现自表示属性。实验结果表明,与AASSC (Adaptive Attribute and Structure Subspace Clustering network)相比,所提方法在MNIST、UMIST、COIL20数据集上的聚类准确率分别提升了1.84、0.49、0.34个百分点。可见,所提方法提高了自表示矩阵学习的准确性,聚类效果更好。

    面向机器阅读理解的边界感知方法
    刘青, 陈艳平, 邹安琪, 黄瑞章, 秦永彬
    2024, 44(7):  2004-2010.  DOI: 10.11772/j.issn.1001-9081.2023081178
    摘要 ( )   HTML ( )   PDF (1315KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的基于预训练语言模型的答案获取方法存在预测边界不够准确的问题,提出一种面向片段抽取式机器阅读理解(MRC)的边界感知方法。首先,在问题输入阶段引入特殊字符标记问题边界,通过增强问题语义信息的方式实现对问题边界的感知;其次,在答案预测阶段,构建答案边界回归器,实现感知的问题边界语义信息与输出的预测答案边界语义信息的语义交互;最后,通过交互后的语义信息进一步调整存在偏差的预测答案边界,实现对预测答案的校准。实验结果表明,与SpanBERT (Span-based Bidirectional Encoder Representation from Transformers)相比,该方法在公共数据集SQuAD(Stanford Question Answering Dataset)1.1上的F1值提升了0.2个百分点、精确匹配(EM)值提升了0.9个百分点;在HotpotQA(Hotpot Question Answering)数据集上的F1值和EM值都提升了0.7个百分点;在NewsQA(News Question Answering)数据集上的F1值提升了2.8个百分点、EM值提升了3.3个百分点。可见,该方法能有效增强对问题边界信息的感知并且实现对预测答案边界的校准,有利于更好地理解和分析文本数据,在智能问答、智能客服等领域的应用中提高系统的准确性。

    基于多尺度混合注意力卷积神经网络的关系抽取模型
    唐媛, 陈艳平, 扈应, 黄瑞章, 秦永彬
    2024, 44(7):  2011-2017.  DOI: 10.11772/j.issn.1001-9081.2023081183
    摘要 ( )   HTML ( )   PDF (1983KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对基于卷积神经网络(CNN)的关系抽取获取句子语义信息时缺少不同尺度语义特征信息的获取以及对关键信息的关注的问题,提出基于多尺度混合注意力CNN的关系抽取模型。首先,将关系抽取建模为二维化表示的标签预测;其次,通过多尺度的特征信息提取与融合,获得更细粒度的多尺度空间信息;然后,通过注意力与卷积的结合自适应地细化特征图,使模型关注重要的上下文信息;最后,使用两个预测器共同预测实体对之间的关系标签。实验结果表明,多尺度混合卷积注意力模型能够获取多尺度语义特征信息,而通道注意力和空间注意力通过权重捕捉通道和空间的关键信息,以此来提升关系抽取的性能。所提模型在数据集SemEval (SemEval-2010 task 8)、TACRED (TAC Relation Extraction Dataset)、Re-TACRED (Revised-TACRED)和SciERC (Entities, Relations, and Coreference for Scientific knowledge graph construction)上的F1值分别达到90.32%、70.74%、85.71%和89.66%。

    基于并行异构图和序列注意力机制的中文实体关系抽取模型
    毛典辉, 李学博, 刘峻岭, 张登辉, 颜文婧
    2024, 44(7):  2018-2025.  DOI: 10.11772/j.issn.1001-9081.2023071051
    摘要 ( )   HTML ( )   PDF (2387KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。

    面向煤矿机电设备领域的三元组抽取方法
    游新冬, 问英姿, 佘鑫鹏, 吕学强
    2024, 44(7):  2026-2033.  DOI: 10.11772/j.issn.1001-9081.2023070943
    摘要 ( )   HTML ( )   PDF (1515KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对机电设备领域相关语料匮乏、关系类型特征挖掘不充分以及文本包含重叠三元组的问题,提出一种融合提示学习与先验知识以迭代式对抗训练的三元组抽取方法TBPA(Triplet extraction Based on Prompt and Antagonistic training)。首先,利用BERT(Bidirectional Encoder Representations from Transformers)模型在自构语料库上进行微调,以获取输入文本的特征向量;接着,采用投影梯度下降(PGD)方法在嵌入层进行迭代式对抗训练,提高模型对干扰样本的抵御能力和对真实样本的泛化能力;然后,利用单层头尾指针网络识别出头实体,并结合提示学习模板获取头实体对应的领域先验特征,将字向量与Prompt模板中预测得到的提示向量相结合;最后,在分层标注框架下,使用单层头尾指针网络逐个识别预定义的所有关系类型所对应的尾实体。与基线模型CasRel相比,TBPA在精确率、召回率和F1值上分别提高了3.10、6.12、4.88个百分点。实验结果表明,TBPA在煤矿机电设备领域三元组抽取任务中具有一定的优势。

    基于改进循环池化网络的核电装备质量文本分类模型
    陆潜慧, 张羽, 王梦灵, 吴庭伟, 单玉忠
    2024, 44(7):  2034-2040.  DOI: 10.11772/j.issn.1001-9081.2023071005
    摘要 ( )   HTML ( )   PDF (1893KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    核电装备质量文本描述了核电装备在设计、采购、施工和调试阶段出现的质量缺陷等问题。由于不同阶段质量事件的发生频率不同,且同一装备对应不同阶段的质量文本中存在相同的关键词和相似的表述形式,针对类型数量不均衡和语义描述耦合的质量文本分类问题,提出一种融合正则反馈焦点损失函数的改进循环池化网络分类模型。首先,采用BERT (Bidirectional Encoder Representation from Transformers) 将核电装备质量文本转化为词向量;然后,提出一个改进的3层循环池化网络的分类模型结构,通过增加中间层并选择合适权重,扩大参数训练的提取空间,提升表征质量缺陷语义特征的能力;接着,提出正则反馈焦点损失函数来训练提出分类模型的参数,通过正则项使损失函数的梯度变化更稳定,根据反馈项对损失函数进行基于真实值和预测值之间误差的迭代调整,解决了不均衡样本在训练过程中梯度偏向不均衡的问题;最后,通过归一化指数函数计算出核电装备质量事件对应的阶段。在某核电公司真实数据集和公共数据集上,与Fast_Text网络相比,所提模型的F1值分别提高了2个百分点和1个百分点,实验结果表明该模型在文本分类任务中具有较高的准确性。

    脑电情感识别中多上下文向量优化的卷积递归神经网络
    晁浩, 封舒琪, 刘永利
    2024, 44(7):  2041-2046.  DOI: 10.11772/j.issn.1001-9081.2023070970
    摘要 ( )   HTML ( )   PDF (1601KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前的脑电(EEG)情感识别模型忽略了不同时段情感状态的差异性,未能强化关键的情感信息。针对上述问题,提出一种多上下文向量优化的卷积递归神经网络(CR-MCV)。首先构造脑电信号的特征矩阵序列,通过卷积神经网络(CNN)学习多通道脑电的空间特征;然后利用基于多头注意力的递归神经网络生成多上下文向量进行高层抽象特征提取;最后利用全连接层进行情感分类。在DEAP (Database for Emotion Analysis using Physiological signals)数据集上进行实验,CR-MCV在唤醒和效价维度上分类准确率分别为88.09%和89.30%。实验结果表明,CR-MCV在利用电极空间位置信息和不同时段情感状态显著性特征基础上,能够自适应地分配特征的注意力并强化情感状态显著性信息。

    基于多尺度聚合和共享注意力的注视估计模型
    施赛龙, 方智文
    2024, 44(7):  2047-2054.  DOI: 10.11772/j.issn.1001-9081.2023081172
    摘要 ( )   HTML ( )   PDF (1857KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    注视估计是从人脸图像中估计3D注视方向的方法,其中与注视直接相关的眼睛细节信息在人脸图像中集中且对注视估计具有显著影响。然而现有的注视估计模型忽略了小尺度的眼睛细节,且容易被图像特征中与注视无关的信息淹没。为此,提出一种基于多尺度聚合和共享注意力的模型以增强特征的表达能力。首先,使用分流自注意力聚合图像中不同尺度的眼睛和人脸信息,并引导模型学习不同尺度对象之间的相关性,以此处理模型对图像中眼睛细节的遗漏问题;其次,通过建立共享注意力来捕获图像之间的共享特征,减少对注视无关特征的关注;最后,结合多尺度聚合和共享注意力,进一步提高注视估计的精度。在公开数据集MPIIFaceGaze、Gaze360、Gaze360_Processed和GAFA-Head上,所提模型的平均角度误差比GazeTR (Gaze TRansformer)降低了5.74%、4.09%、4.82%和10.55%。在Gaze360背对相机的困难图像上,所提模型的平均角度误差比GazeTR降低了4.70%。实验结果表明,所提模型能有效聚合多尺度的注视信息和共享注意力,提高注视估计的准确性和鲁棒性。

    基于深度强化学习的移动机器人三维路径规划方法
    马天, 席润韬, 吕佳豪, 曾奕杰, 杨嘉怡, 张杰慧
    2024, 44(7):  2055-2064.  DOI: 10.11772/j.issn.1001-9081.2023060749
    摘要 ( )   HTML ( )   PDF (5732KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对三维未知环境中存在的高复杂度和不确定性的问题,提出一种在有限观测空间优化策略下基于深度强化学习的移动机器人三维路径规划方法。首先,在有限观测空间下采用深度图信息作为智能体的输入,模拟移动受限且未知的复杂三维空间环境;其次,设计了两阶段离散动作空间下的动作选择策略,包括方向动作和位移动作,以减少搜索步数和时间;最后,在近端策略优化(PPO)算法基础上,添加门控循环单元(GRU)结合历史状态信息,以提升未知环境中搜索策略的稳定性,进而提高规划路径准确度和平滑度。实验结果表明,相较于A2C(Advantage Actor-Critic),所提方法的平均搜索时间缩短了49.07%,平均规划路径长度缩短了1.04%,同时能够完成线性时序逻辑约束下的多目标路径规划任务。

    数据科学与技术
    基于多尺度时空图卷积网络的交通出行需求预测
    李欢欢, 黄添强, 丁雪梅, 罗海峰, 黄丽清
    2024, 44(7):  2065-2072.  DOI: 10.11772/j.issn.1001-9081.2023071045
    摘要 ( )   HTML ( )   PDF (1969KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    满足公众高质量出行需求是智能交通系统(ITS)的主要挑战之一。目前,针对公共交通出行需求预测问题,现有模型大多采用固定结构的图描述出行需求的空间相关性,忽略了出行需求在不同尺度下具有不同的空间依赖关系。针对上述问题,提出一种多尺度时空图卷积网络(MSTGCN)模型。该模型首先从全局尺度和局部尺度构建全局需求相似图和局部需求相似图,这2种图可以捕获公共交通出行需求长期内较为稳定的全局特征和短期内动态变化的局部特征。利用图卷积网络(GCN)提取2种图中的全局空间信息和局部空间信息,并引入注意力机制融合两种空间信息。为了拟合时间序列中潜藏的时间依赖关系,利用门控循环单元(GRU)捕捉公共交通需求的时变特征。采用纽约市出租车订单数据集和自行车订单数据集进行实验,结果表明MSTGCN模型在自行车订单数据集上均方根误差(RMSE)、平均绝对误差(MAE)和皮尔逊相关系数(PCC)达2.788 6、1.737 1、0.799 2,在出租车订单数据集上RMSE、MAE、PCC达9.573 4、5.861 2、0.963 1。可见,MSTGCN模型可以有效地挖掘公共交通出行需求的多尺度时空特性,对未来公共交通出行需求进行准确预测。

    矩阵数据基于鲁棒主成分分析的距离加权判别分析
    葛焌迟, 赵为华
    2024, 44(7):  2073-2079.  DOI: 10.11772/j.issn.1001-9081.2023070923
    摘要 ( )   HTML ( )   PDF (3828KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    距离加权判别(DWD)是一种已被广泛应用的矩阵数据分类模型,当数据中存在严重的噪声污染时,该模型的性能会明显下降。鲁棒主成分分析(RPCA)因具备分离数据矩阵低秩结构和稀疏部分的特性已成为解决该问题的有效手段之一。因此,提出一种矩阵数据鲁棒距离加权判别(RDWD-2D)模型。特别地,该模型以有监督的方式对数据矩阵进行鲁棒主成分分析,并同步实现干净数据的恢复与分类。在MNIST和COIL20数据集上的实验结果表明,针对有噪声污染或数据缺失的矩阵数据,与DWD-2D、RPCA+DWD等模型相比,RDWD-2D模型有最好的数据恢复能力和最高的分类准确率;同时RDWD-2D模型对于数据污染度也有较好的鲁棒性。

    网络空间安全
    基于暗知识保护的模型窃取防御技术DKP
    张郅, 李欣, 叶乃夫, 胡凯茜
    2024, 44(7):  2080-2086.  DOI: 10.11772/j.issn.1001-9081.2023071056
    摘要 ( )   HTML ( )   PDF (1427KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在黑盒场景下,使用模型功能窃取方法生成盗版模型已经对云端模型的安全性和知识产权保护构成严重威胁。针对扰动和软化标签(变温)等现有的模型窃取防御技术可能导致模型输出中置信度最大值的类别发生改变,进而影响原始任务中模型性能的问题,提出一种基于暗知识保护的模型功能窃取防御方法,称为DKP(defending against model stealing attacks based on Dark Knowledge Protection)。首先,利用待保护的云端模型对测试样本进行处理,以获得样本的初始置信度分布向量;然后,在模型输出层之后添加暗知识保护层,通过分区变温调节softmax机制对初始置信度分布向量进行扰动处理;最后,得到经过防御的置信度分布向量,从而降低模型信息泄露的风险。使用所提方法在4个公开数据集上取得了显著的防御效果,尤其在博客数据集上使盗版模型的准确率降低了17.4个百分点,相比之下对后验概率进行噪声扰动的方法仅能降低约2个百分点。实验结果表明,所提方法解决了现有扰动、软化标签等主动防御方法存在的问题,在不影响测试样本分类结果的前提下,通过扰动云端模型输出的类别概率分布特征,成功降低了盗版模型的准确率,实现了对云端模型机密性的可靠保障。

    基于变色龙哈希和可验证秘密共享的联盟链修改方法
    宋宝燕, 丁俊翔, 王俊陆, 张浩林
    2024, 44(7):  2087-2092.  DOI: 10.11772/j.issn.1001-9081.2023081179
    摘要 ( )   HTML ( )   PDF (1806KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    区块链具有去中心化、不可篡改、可追溯等特征。现有的联盟链系统在数据上链后会全程留痕,当出现敏感信息或恶意数据时无法处理,或处理后区块链分叉、中断。针对这些问题,提出一种基于变色龙哈希和可验证秘密共享的联盟链数据修改方法。首先,把变色龙哈希的陷门再分配给身份节点,从而将发起修改者与实际修改者进行隔离;其次,为保证再分配值的正确性,将不同时间周期变色龙哈希所对应的数据设为可验证数据,用验证节点上传承诺到可验证数据,并用提案节点通过承诺验证秘密共享值;最后,为防止节点作恶,提出基于奖励金机制的数据纠正方法提高节点纠正作恶的积极性,降低作恶的可能。在中山大学区块链与智能金融研究中心InPlusLab开发的DApps数据集上进行实验的结果表明:当恶意节点数30个时,所提方法相较于用传统变色龙哈希修改联盟链数据的方法在处理恶意节点的效率方面提高了44.1%;当恶意数据量达到30条时,在处理恶意数据的时间上缩短了53.7%。

    基于投票和以太坊智能合约的云数据审计方案
    黄河, 金瑜
    2024, 44(7):  2093-2101.  DOI: 10.11772/j.issn.1001-9081.2023071036
    摘要 ( )   HTML ( )   PDF (2265KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    确保云数据的完整性是亟待解决的安全挑战,受到广泛应用的区块链技术为应对该安全挑战提供了良好的解决方案。当前结合区块链和智能合约技术,并由矿工参与审计验证工作的方案存在审计效率低、通信开销大和数据拥有者(DO)审计负担重等不足。针对上述问题,提出一种基于投票和以太坊智能合约的云数据审计方案(CASVEC)。首先,结合投票机制和智能合约技术在以太坊上设计并部署了去中心化自治组织(DAO),DAO中节点投票选举出一个审计节点代替矿工的审计验证工作,从而有效解决验证审计证明阶段效率低的问题,并且投票机制引入信誉值保证投票公平可靠。其次,仅使用少量链上资源存储审计结果以降低通信过程中的数据量,从而有效解决验证审计证明阶段通信开销大的问题。此外,DO仅需向DAO委托一次审计请求以及查询最终的审计结果,无需频繁调用智能合约交换审计相关信息,减轻了审计负担。最后,从理论和实验角度验证了与当前基于区块链的云审计方案相比,CASVEC能够显著降低验证审计证明阶段的时间开销和通信开销,以及审计阶段DO的时间开销。

    基于多尺度注意力的生成式信息隐藏算法
    刘丽, 侯海金, 王安红, 张涛
    2024, 44(7):  2102-2109.  DOI: 10.11772/j.issn.1001-9081.2023070919
    摘要 ( )   HTML ( )   PDF (4109KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有生成式信息隐藏算法嵌入容量低且提取的秘密图像视觉质量欠佳的问题,提出基于多尺度注意力的生成式信息隐藏算法。首先,设计基于多尺度注意力的双编码-单解码生成器,载体图像与秘密图像的特征在编码端分两个支路独立提取,在解码端通过多尺度注意力模块进行融合,并利用跳跃连接为解码端提供不同尺度的细节特征,从而获得高质量的载密图像。其次,在U-Net结构的提取器中引入自注意力模块,以弱化载体图像特征、增强秘密图像深层特征,并利用跳跃连接弥补秘密图像细节特征,提高秘密信息提取的准确率;同时,多尺度判决器与生成器的对抗训练可以有效提升载密图像的视觉质量。实验结果表明,所提算法在嵌入容量为24 bpp的情况下,生成的载密图像峰值信噪比(PSNR)和结构相似性(SSIM)平均可达到40.93 dB和0.988 3,且提取的秘密图像PSNR和SSIM平均可达到30.47 dB和0.954 3。

    基于差异阈值循环分组的密钥生成算法
    李贵勇, 何斌, 方磊
    2024, 44(7):  2110-2115.  DOI: 10.11772/j.issn.1001-9081.2023070917
    摘要 ( )   HTML ( )   PDF (2048KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对无线通信中通信双方提取的信道特征存在明显差异,导致双方的密钥生成速率和一致率较低的问题,提出差异阈值循环分组的密钥生成算法(TGKG)。首先,对信道状态信息(CSI)进行差异阈值分组,使任意组内元素间的间隔均大于该值,提高组内数据的差异,减小量化误差以降低密钥不一致率;循环分组只需一方进行,防止因数据误差导致的分组不一致。同时,提取信道系数的实部和虚部量化,增加量化比特数目,提高了密钥生成速率。通过概率论及信息论公式证明了所提算法在密钥不一致率、密钥可达速率和安全性3方面的优势。实验结果表明,所提算法在5 dB信噪比(SNR)条件下,通信双方的密钥不一致率约为2%,密钥生成速率约为142%。

    基于非正交离散变换的物理不可克隆函数可靠性提升算法
    李诗扬, 倪少杰, 邓丁, 陈雷, 林红磊
    2024, 44(7):  2116-2122.  DOI: 10.11772/j.issn.1001-9081.2023070936
    摘要 ( )   HTML ( )   PDF (2608KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了解决物理不可克隆函数(PUF)受外部环境和自身老化因素影响存在响应不稳定的问题,提出基于非正交离散(NOD)变换的PUF可靠性提升算法。首先,设计了一种重排序混淆器,将随机种子向量及PUF响应经重排序混淆器迭代处理后得到非正交混淆矩阵与混淆响应矩阵的内积,据此建立NOD谱,有效缓解了因PUF本身均匀性不足而产生偏向性密钥的问题;随后,通过分区编解码策略,赋予NOD谱一定的波动容错能力,将不稳定响应的影响限制在有限的范围,从而显著提高最终响应的可靠性。所提算法相较于传统基于纠错码的方法,需要的帮助数据更少。基于SRAM-XMC数据集进行实验,所提算法在对2 949 120组64位响应进行101次重复实验过程中平均可靠性达到99.97%,唯一性达到49.92%,均匀性达到50.61%。实验结果表明,所提算法能够在保证PUF响应均匀性与唯一性的同时有效提高可靠性。

    海洋船舶通信网络安全综述
    吴中岱, 韩德志, 蒋海豹, 冯程, 韩冰, 陈重庆
    2024, 44(7):  2123-2136.  DOI: 10.11772/j.issn.1001-9081.2023070975
    摘要 ( )   HTML ( )   PDF (3942KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    海上运输是人类最重要的运输方式之一,海上船舶通信网络安全对一个涉海国家的经济发展至关重要。由于海上船舶通信网络基础设施建设远不如陆地互联网络基础设施建设完善,其通信网络存在很多安全漏洞,导致多起船舶在海洋航行时遭受网络攻击。近几年,国内外已有大量有关海上通信网络安全的研究文献,但缺乏海洋船舶通信网络安全研究综述文献发表。为此,针对海洋船舶通信网络结构、存在的网络安全风险及其应对安全措施等研究文献进行系统的梳理和综合讨论。在此基础上,对海上船舶通信网络安全威胁提出应对的策略和建议。

    先进计算
    随机正则3-可满足性问题的解簇结构分析
    庞立超, 王晓峰, 谢志新, 杨易, 赵星宇, 杨澜
    2024, 44(7):  2137-2143.  DOI: 10.11772/j.issn.1001-9081.2023070940
    摘要 ( )   HTML ( )   PDF (2297KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    正则3-可满足性(3-SAT)问题是一个NP难问题,研究正则3-SAT问题解簇结构变化,旨在深入理解该问题的判定难度和可满足性解的分布情况。然而,现有分析模型只研究了接近簇集相变点的几个离散值,在不同约束密度下,缺乏统一的分析模型来描述解簇的结构演变。为了解决这一问题,提出解簇结构相变分析模型(PMSS)。该模型主要思想是采用WalkSAT算法和信息传播算法求得正则3-SAT问题可满足的初始解,再利用随机游走构造该初始解的解簇,并对解簇进行分析。用模块度和社区度量解簇社区结构,用结构熵度量解簇结构复杂性。实验结果表明,PMSS能够准确分析解簇结构演变过程,并且正则3-SAT问题实例的可满足相变点位于13~14,与使用Zchaff求解器得到的相变点一致,进一步验证了PMSS的有效性。

    基于加权犹豫模糊集的实验设计与分阶段PSO-Kriging建模
    高培根, 锁斌
    2024, 44(7):  2144-2150.  DOI: 10.11772/j.issn.1001-9081.2023070982
    摘要 ( )   HTML ( )   PDF (1631KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    过高的实验成本导致输出为非线性多极值的复杂系统获得的实验样本点少,建立的代理模型精度较低。针对此现状提出一种基于先验信息的实验设计与建模方法。该方法利用先验信息划分实验设计域,并根据波动性指标构建各区域的加权犹豫模糊集,增加评价结果的合理性;结合各区域的波动性与范围大小决定实验样本点个数,由汉默斯里序列采样获取样本点;再将分阶段搜索粒子群算法与Kriging方法结合,提高代理模型的计算精度。以模拟平面桁架结构的损伤模型验证所提方法的有效性。实验结果表明,与汉默斯里序列采样、拉丁超立方设计建立的模型相比,所提方法建立的模型拟合优度平均提升0.84%和4.94%,均方根误差平均降低31.02%和57.18%。

    计算机软件技术
    基于源码分析的自动化外部函数接口生成方法
    孙蒴, 张伟, 冯温迪, 张俞炜
    2024, 44(7):  2151-2159.  DOI: 10.11772/j.issn.1001-9081.2023070968
    摘要 ( )   HTML ( )   PDF (3540KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    外部函数接口(FFI)是解决一种编程语言调用其他语言函数库的主要方法。针对使用FFI技术时需要大量人工编码的问题,提出自动化外部函数接口生成(AFIG)方法。该方法利用基于抽象语法树的源码逆向分析技术,从被封装的库文件中精准提取出用于描述函数接口信息的多语言融合的统一表示。基于此统一表示,不同平台的代码生成器可利用多语言转换规则矩阵,全自动化地生成不同平台的FFI相关代码。为解决FFI代码生成中的效率低下问题,设计了一种基于依赖分析的任务聚合策略,通过把存在依赖的任务聚合为新的任务,有效消除了FFI代码任务在并行下的阻塞与死锁,从而实现任务在多核系统下的可扩展与负载均衡。实验结果表明:与人工编码相比,AFIG方法减少了FFI开发中98.14%的开发编码量以及41.95%的测试编码量;与现有的SWIG (Simplified Wrapper and Interface Generator)方法相比,在同等任务下可减少61.27%的开发成本;且生成效率随着计算资源的增加呈线性增长。

    基于用户系统调用序列的二进制代码识别
    黄海翔, 彭双和, 钟子煜
    2024, 44(7):  2160-2167.  DOI: 10.11772/j.issn.1001-9081.2023070992
    摘要 ( )   HTML ( )   PDF (2494KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对编译优化、跨编译器、混淆等带来的二进制代码相似性识别准确率低的问题,提出并实现了一种基于用户系统调用序列的识别方案UstraceDiff。首先,基于Intel Pin框架设计了一个动态分析插桩工具,动态提取二进制代码的用户系统调用序列及参数;其次,通过序列对齐获得被分析的2个二进制代码的系统调用序列的公有序列,并设计了一个有效参数表用于筛选出有效系统调用参数;最后,为评估二进制代码的相似性,提出一种算法利用公有序列及有效参数,计算它们的同源度。使用Coreutils数据集在4种不同的编译条件下对UstraceDiff进行了评估。实验结果表明,相较于Bindiff和DeepBinDiff,UstraceDiff对于同源程序识别的平均准确率分别提高了35.1个百分点和55.4个百分点,对于非同源程序的区分效果也更好。

    基于局部信息的服务迁移路径选择算法
    田润泽, 周宇龙, 朱洪, 薛岗
    2024, 44(7):  2168-2174.  DOI: 10.11772/j.issn.1001-9081.2023070921
    摘要 ( )   HTML ( )   PDF (1021KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着移动边缘计算技术的高速发展,提供高质量的移动服务需要根据用户实时的移动轨迹变化多元地考虑网络通信中的影响因素来动态地规划服务迁移路径。针对现有服务迁移路径规划研究中对城市场景下用户移动轨迹预测缺失、规划迁移路径与用户移动路径相似度较低等问题,提出一种根据用户实时移动轨迹的服务移动路径选择算法。首先通过基于长短期记忆(LSTM)模型的轨迹预测算法和基于隐马尔可夫模型(HMM)的路网匹配算法预测用户未来移动轨迹,然后根据预测移动轨迹与邻近局部基站状态信息选择最佳迁移边缘服务器,进而完成城市场景下基于网格地图的服务迁移路径选择。在深圳市出租车轨迹数据集与手机基站状态数据集所构造的数据集上,相较于改进深度优先搜索(DFS)算法、改进A*算法、基于矩阵的动态多路径选择(MDMPS)算法和基于矩形区域划分的服务迁移路径选择(GDSMPS)算法,所提算法的平均服务迁移时间分别减少了34.8%、44.5%、24.9%和12.7%,平衡路径相似度分别提升了26.2%、49.7%、14.3%和4.7%;在噪声数据集和长路径数据集上,所提算法的平均服务迁移时间波动幅度最小且平均轨迹相似度最高。实验结果表明,所提算法不仅可以有效减少服务迁移时间,提升迁移路径与用户移动路径的相似度,而且具有良好的抗数据噪声能力与优秀的长路径规划能力。

    多媒体计算与计算机仿真
    结合空间域和频域信息的双分支低光照图像增强网络
    李大海, 王忠华, 王振东
    2024, 44(7):  2175-2182.  DOI: 10.11772/j.issn.1001-9081.2023070933
    摘要 ( )   HTML ( )   PDF (3079KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对低光照图像增强中纹理细节模糊和颜色失真的问题,从空间域和频域信息结合的角度出发,提出一个端到端的轻量级双分支网络(SAFNet)。SAFNet使用基于Transformer的空间域处理模块和频域处理模块在空间域分支和频域分支分别对图像的空间域信息和傅里叶变换后的频域信息进行处理,并通过注意力机制引导两个分支的特征进行自适应融合,得到最终增强的图像。此外,针对频域信息提出一个频域损失函数作为联合损失函数的一部分,通过联合损失函数在空间域和频域都对SAFNet进行约束。在公开数据集LOL和LSRW上进行实验,在LOL上,SAFNet在客观指标结构相似性(SSIM)和学习感知图像块相似度(LPIPS)两项指标上分别达到0.823和0.114;在LSRW上,峰值信噪比(PSNR)和SSIM分别达到17.234 dB和0.550,均优于LLFormer (Low-Light Transformer)、IAT (Illumination Adaptive Transformer)、 KinD (Kindling the Darkness)++等主流方法,且网络参数量仅为0.07×106;在DarkFace数据集上,使用SAFNet作为预处理步骤对待检测图像进行增强,可以使人脸检测平均精确率从52.6%提升至72.5%。实验结果表明,SAFNet能有效提高低光照图像的质量,并能显著改善下游任务低光照人脸检测的性能。

    基于光照权重分配和注意力的红外与可见光图像融合深度学习模型
    魏文亮, 王阳萍, 岳彪, 王安政, 张哲
    2024, 44(7):  2183-2191.  DOI: 10.11772/j.issn.1001-9081.2023070976
    摘要 ( )   HTML ( )   PDF (3503KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有红外与可见光图像融合模型在融合过程中忽略光照因素、使用常规的融合策略,导致融合结果存在细节信息丢失、显著信息不明显等问题,提出一种基于光照权重分配和注意力的红外与可见光图像融合深度学习模型。首先,设计光照权重分配网络(IWA-Net)来估计光照分布并计算光照权重;其次,引入CM-L1范式融合策略提高像素之间的依赖关系,完成对显著特征的平滑处理;最后,由全卷积层构成解码网络,完成对融合图像的重构。在公开数据集上的融合实验结果表明,所提模型相较于对比模型,所选六种评价指标均有所提高,其中空间频率(SF)和互信息(MI)指标分别平均提高了45%和41%,有效减少边缘模糊,使融合图像具有较高的清晰度和对比度。该模型的融合结果在主客观方面均优于其他对比模型。

    基于时空信息的轻量视频显著性目标检测网络
    徐松, 张文博, 王一帆
    2024, 44(7):  2192-2199.  DOI: 10.11772/j.issn.1001-9081.2023070926
    摘要 ( )   HTML ( )   PDF (2111KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有视频显著性目标检测(VSOD)网络面临2个问题:一是在捕获时间信息时计算成本过大,导致网络难以在移动端实际应用;二是网络泛化能力较弱,难以处理视频中诸如遮挡、运动模糊等挑战性场景。因此,提出一种基于动态滤波器和对比学习思想的轻量视频显著性目标检测网络。首先,对连续帧的每帧图像进行粗略的前景特征点采样并进行相似度矩阵的计算,利用相似度矩阵进行加权从而滤除存在的噪声特征;其次,用滤波后的前景特征生成动态滤波器参数,对原始特征图执行卷积操作以提取前景物体;同时在训练阶段设计了一个对比学习模块帮助网络学习,在推理阶段并不会引入额外的计算量。在三个数据集DAVIS、DAVSOD和VOS上进行了广泛实验,实验结果表明,所提网络相较于DCFNet (Dynamic Context-sensitive Filtering Network for video salient object detection),在F-measure、S-measure以及平均绝对误差(MAE)3个指标上性能接近,帧率从28 frame/s提升到38 frame/s,提升了35.7%,同时网络参数量仅有15.6×106,更有利于实际应用中在边缘侧进行部署。

    基于改进VariFocalNet的微小目标检测
    姬张建, 杜娜
    2024, 44(7):  2200-2207.  DOI: 10.11772/j.issn.1001-9081.2023071033
    摘要 ( )   HTML ( )   PDF (1781KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对航拍场景中包含的目标尺寸小、有效特征信息少的问题,提出一种基于改进的变焦网络VFNet(VariFocalNet)的航拍场景中微小目标检测算法。首先,为增强微小目标的特征表征能力,采用特征提取性能更好的循环层聚合网络(RLANet)代替ResNet作为主干网络;其次,为解决特征金字塔自顶向下融合时顶层特征信息丢失问题,引入特征增强模块(FEM);然后,为解决现有标签分配方法在微小目标标签分配上的样本分布不平衡问题,改进的VFNet采用了基于高斯感受野的标签分配方法;最后,为减小微小目标对位置偏移的敏感性,引入一种边界框回归损失函数Wasserstein损失测量预测边界框高斯分布和真值框高斯分布的相似性。在AI-TOD数据集上的实验结果表明:改进后的VFNet算法的平均精度均值(mAP)达到了14.9%;与改进前的算法相比,在航拍场景下的微小目标上的检测mAP提高了4.7个百分点。

    基于深度与实例分割融合的单目3D目标检测方法
    孙逊, 冯睿锋, 陈彦如
    2024, 44(7):  2208-2215.  DOI: 10.11772/j.issn.1001-9081.2023070990
    摘要 ( )   HTML ( )   PDF (4804KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对单目3D目标检测在视角变化引起的物体大小变化以及物体遮挡等情况下效果不佳的问题,提出一种融合深度信息和实例分割掩码的新型单目3D目标检测方法。首先,通过深度-掩码注意力融合(DMAF)模块,将深度信息与实例分割掩码结合,以提供更准确的物体边界;其次,引入动态卷积,并利用DMAF模块得到的融合特征引导动态卷积核的生成,以处理不同尺度的物体;再次,在损失函数中引入2D-3D边界框一致性损失函数,调整预测的3D边界框与对应的2D检测框高度一致,以提高实例分割和3D目标检测任务的效果;最后,通过消融实验验证该方法的有效性,并在KITTI测试集上对该方法进行验证。实验结果表明,与仅使用深度估计图和实例分割掩码的方法相比,在中等难度下对车辆类别检测的平均精度提高了6.36个百分点,且3D目标检测和鸟瞰图目标检测任务的效果均优于D4LCN(Depth-guided Dynamic-Depthwise-Dilated Local Convolutional Network)、M3D-RPN(Monocular 3D Region Proposal Network)等对比方法。

    基于非对称多解码器和注意力模块的三维肾脏影像结构分割模型
    孔哲, 李寒, 甘少伟, 孔明茹, 何冰涛, 郭子钰, 金督程, 邱兆文
    2024, 44(7):  2216-2224.  DOI: 10.11772/j.issn.1001-9081.2023060773
    摘要 ( )   HTML ( )   PDF (2905KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对肾脏结构中,因不同结构间差异大,动静脉体积小、结构薄及计算机断层扫描血管造影(CTA)图像灰度分布不均和伪影带来的精确分割困难的问题,提出基于非对称多解码器和注意力模块的三维肾脏影像结构分割模型MDAUnet(MultiDecoder-Attention-Unet)。首先,针对不同结构间差异大导致网络无法共享权重的问题,采用多解码器结构,为语义结构不同的特征结构匹配不同的解码器分支;其次,针对血管体积小、结构薄难分割的问题,引入非对称的空间通道联合注意力模块使模型更关注管状结构,并对学习到的特征信息同时进行空间维度和通道维度的校准;最后,为了保证模型在反向传播中对血管结构有足够的关注,提出改进的加权硬区域适应损失(WHRA)作为损失函数来动态保持训练过程中血管结构的类间平衡以及保留背景信息的特征;此外,为了提高特征图灰度值的对比度,将传统图像处理边缘检测算子嵌入模型的预处理阶段,对待分割的感兴趣区域边界进行特征增强使模型更关注边界信息并抑制伪影信息。实验结果表明:所提出的MDAUnet模型在肾脏结构分割任务上的Dice相似系数(DSC),豪斯多夫距离95(HD95)和平均表面距离(AVD)分别为89.1%,1.76 mm和1.04 mm;在DSC指标上,与次优的MGANet(Meta Greyscale Adaptive Network)相比,MDAUnet提升了1.2个百分点;在HD95和ASD指标上,与次优的UNETR(UNEt TRansformers)相比,MDAUnet分别降低了0.87 mm和0.45 mm。可见MDAUnet能有效提高肾脏三维结构分割精度,有助于医生在临床手术中客观有效地评估病情。

    基于多尺度混合域注意力机制的笔迹鉴别方法
    熊武, 曹从军, 宋雪芳, 邵云龙, 王旭升
    2024, 44(7):  2225-2232.  DOI: 10.11772/j.issn.1001-9081.2023071018
    摘要 ( )   HTML ( )   PDF (2275KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对笔迹鉴别任务中图像大面积是背景、笔迹信息稀疏、关键性信息难以捕捉,并且个人笔迹签名风格具有微小变化而刻意模仿的笔迹高度相似,以及公开的中文笔迹数据集的匮乏的问题,通过对注意力机制和孪生网络模型进行改进,提出一种基于多尺度混合域注意力机制的笔迹鉴别方法(MMDANet)。首先,在有效通道注意力模块上并联一个最大池化层,并将二维条带池化模块的通道数扩展到三维,将改进的有效通道注意力模块和条带池化模块融合生成混合域模块(MDM),解决了笔迹图像大面积是背景、笔迹信息稀疏、细节特征难以提取的问题;其次,利用PANet特征金字塔进行多尺度提取特征,捕获真伪笔迹间的细微差异,采用孪生网络的对比损失与AM-Softmax损失加权融合进行训练,增加类别间的区分度,解决个人笔迹风格变化和真伪笔迹高度相似的问题;最后自制了总体样本数为8 000的中文笔迹数据集(CHD)。所提方法在自制中文数据集CHD上的准确率达到了84.25%,且相较于次优的Two-stage SiamNet方法,所提方法在3个外文数据集Cedar、Bengla和Hindi上准确率分别提升了4.53%、1.02%和1.67%。实验结果表明,MMDANet可以更准确地捕获真伪笔迹的细微差异,完成复杂的笔迹鉴别任务。

    基于像素距离图和四维动态卷积网络的密集人群计数与定位方法
    高阳峄, 雷涛, 杜晓刚, 李岁永, 王营博, 闵重丹
    2024, 44(7):  2233-2242.  DOI: 10.11772/j.issn.1001-9081.2023070918
    摘要 ( )   HTML ( )   PDF (4123KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于卷积神经网络(CNN)获得回归密度图的方法已成为人群计数与定位的主流方法,但现有方法仍存在两个问题:首先传统方法获得的密度图在人群密集区域存在粘连和重叠问题,导致网络最终人群计数和定位错误;其次,常规卷积由于其权重不变,无法实现对图像特征的自适应提取,难以处理复杂背景和人群密度分布不均匀的图像。为解决上述问题,提出一种基于像素距离图(PDMap)和四维动态卷积网络(FDDCNet)的密集人群计数与定位方法。首先定义了一种新的PDMap,利用像素级标注点之间的空间距离关系,通过取反操作提高人头中心点周围像素的平滑度,避免人群密集区域的粘连重叠;其次,设计了一种FDDC模块,自适应地改变卷积四个维度的权重,提取不同视图提供的先验知识,应对复杂场景和分布不均匀导致的计数与定位困难,提高网络模型的泛化能力和鲁棒性;最后,采用阈值过滤局部不确定预测值,进一步提高计数与定位的准确性。在NWPU-Crowd数据集的测试集上:在人群计数方面,所提方法的平均绝对误差(MAE)和均方误差(MSE)分别为82.4和334.7,比MFP-Net(Multi-scale Feature Pyramid Network)分别降低了8.7%和26.9%;在人群定位方面,所提方法的综合评价指标F1值和精确率分别为71.2%和73.6%,比TopoCount(Topological Count)方法分别提升了3.0%和5.9%。实验结果表明,所提方法能够处理复杂背景的密集人群图像,取得了更高的计数准确率和定位精准度。

    基于正态逆伽马分布的多尺度融合人群计数算法
    李伟, 张晓蓉, 陈鹏, 李清, 张长青
    2024, 44(7):  2243-2249.  DOI: 10.11772/j.issn.1001-9081.2023060782
    摘要 ( )   HTML ( )   PDF (2793KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对人群分析任务中往往存在的因监控与人群距离不同而导致的尺度变化大的问题,提出一种基于正态逆伽马分布的多尺度融合人群计数算法MSF(Multi-Scale Fusion crowd counting)。首先,使用传统骨架提取公共特征,通过多尺度信息提取模块获得图像中不同尺度的行人信息;其次,每个尺度的网络各自包含一个人群密度估计模块和一个用于评估每个尺度预测结果可信度的不确定估计模块;最后,多尺度预测融合模块依据可信度对多尺度预测结果进行动态融合,以获得更准确的密度回归结果。实验结果表明,现有算法密集场景识别网络(CSRNet)在通过多尺度可信融合扩展后,在UCF-QNRF数据集上人群计数的平均绝对误差(MAE)和均方误差(MSE)分别减小了4.43%和1.37%,验证了MSF算法的合理性和有效性。此外,与现有算法不同,MSF算法不仅可以预测人群密度,还可以在部署阶段提供预测的可信程度,从而使算法在实际应用中能及时预警模型预测不准确的区域,降低后续分析任务出现错误预判的风险。

    基于多层级精细特征融合的步态识别算法
    刘瑞华, 郝子赫, 邹洋杨
    2024, 44(7):  2250-2257.  DOI: 10.11772/j.issn.1001-9081.2023070977
    摘要 ( )   HTML ( )   PDF (2168KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着深度学习的引入,步态识别算法取得了很大的突破,但是仍存在忽略了浅层网络提取的细节信息,以及对不限时长的步态视频时空信息难以融合的问题。为了有效利用浅层特征和融合时空特征,提出一种基于多层级精细特征融合的跨视角步态识别算法。所提算法由两个部分组成:边缘运动捕捉模块(EMCM)用于提取包含时间信息的边缘运动特征;多层级特征提取模块(MFEM)用于提取包含不同粒度全局和局部信息的多层级精细特征。首先,使用EMCM和MFEM分别提取多层级精细特征和边缘运动特征;然后,将两个模块提取的特征融合得到具有鉴别性的步态特征;最后,在公开数据集CASIA-B上和OU-MVLP上进行多种情况下的对比实验。在CASIA-B上平均识别准确率可达89.9%,与GaitPart相比,所提算法的平均识别准确率提升了1.1个百分点;在OU-MVLP上90°视角下比GaitSet识别准确率提升了3.0个百分点。所提算法能够有效地提升多种情况下的步态识别的准确率。

    基于深度学习的患者麻醉复苏过程中的头部运动幅度分类方法
    吴筝, 程志友, 汪真天, 汪传建, 王胜, 许辉
    2024, 44(7):  2258-2263.  DOI: 10.11772/j.issn.1001-9081.2023071017
    摘要 ( )   HTML ( )   PDF (2845KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    头部姿态估计在很多领域都有广泛研究,然而在医学领域,利用头部姿态估计去监测麻醉恢复室(PACU)中患者复苏的研究很少。现有的从单个图像中学习用于头部姿态估计的细粒度结构聚合网络(FSA-Net)存在收敛效果差、参数过拟合的问题。针对以上问题,利用300W-LP、AFLW2000和BIWI共3个公开数据集,对患者麻醉复苏过程中的头部运动进行监测,基于头部姿态估计提出一种患者头部运动幅度分类方法。首先,将FSA-Net其中一个stream的激活函数线性整流单元(ReLU)替换为带有泄漏修正线性单元(LeakyReLU),从而优化模型的收敛效果,同时用AdamW(Adam Weight decay optimizer)优化器替换Adam优化器,解决参数过拟合问题。其次,对患者麻醉复苏中头部运动幅度进行分类,分为小幅度、中幅度以及大幅度运动。最后,利用PHP (Hypertext Preprocessor)、Echarts (EnterpriseCharts)以及PostgreSQL实现数据可视化,绘制患者头部运动实时监测图。实验结果表明,在AFLW2000数据集和BIWI数据集上,改进的FSA-Net的平均绝对误差比原FSA-Net的平均绝对误差分别减小了0.334°和0.243°。改进模型在麻醉复苏检测中具有实际效果,能够辅助医护人员对患者进行麻醉复苏判定。

    基于加强特征提取的道路病害检测算法
    龙伍丹, 彭博, 胡节, 申颖, 丁丹妮
    2024, 44(7):  2264-2270.  DOI: 10.11772/j.issn.1001-9081.2023070956
    摘要 ( )   HTML ( )   PDF (2806KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对道路病害区域小、类别数量不均衡导致检测困难的问题,提出基于YOLOv7-tiny的道路病害检测算法RDD-YOLO。首先,采用K-means++算法得到拟合目标尺寸更好的锚框。其次,在小目标检测支路上使用量化感知重参数化模块(QARepVGG),增强浅层特征提取,同时构建加强注意力模块(AM-CBAM)嵌入颈部的3个输入,抑制复杂背景干扰。然后,设计特征融合模块(Res-RFB),模拟人眼扩大感受野融合多尺度信息,提高表征能力;另外,构造轻量级解耦头(S-DeHead)提高小目标检测精确率。最后,采用归一化Wasserstein距离度量(NWD)优化小目标定位过程,并缓解样本不均衡问题。实验结果表明,与YOLOv7-tiny相比,RDD-YOLO算法在仅增加0.71×106参数量和1.7 GFLOPs计算量的成本下,mAP50提高6.19个百分点,F1-Score提高5.31个百分点,并且检测速度达到135.26 frame/s,满足道路养护工作中对检测精度和速度的需求。

    面向轻量化的改进YOLOv7棉杂检测算法
    张勇进, 徐健, 张明星
    2024, 44(7):  2271-2278.  DOI: 10.11772/j.issn.1001-9081.2023070969
    摘要 ( )   HTML ( )   PDF (8232KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对棉纺厂原棉吞吐量大、检测时间长而常见卷积神经网络无法实现高实时检测的问题,提出基于轻量化改进的YOLOv7模型对原棉杂质的检测算法,旨在快速高效地对棉杂质进行检测。首先通过删减YOLOv7模型冗余的卷积层从而提高检测速度;其次在主干网络内添加FasterNet卷积降低模型的计算负担,减少特征图的冗余性,实现高实时检测;最后在颈部网络内运用CSP-RepFPN(Cross Stage Partial networks with Replicated Feature Pyramid Network)重构特征金字塔,增加特征信息流通,减少特征损失,提高检测精度。实验结果表明:在自建棉杂数据集上改进的YOLOv7模型在棉杂检测精度上达到了96.0%,检测时间比YOLOv7减少了37.5%;在公开DWC(Drinking Waste Classification)数据集上整体精度达到82.5%,检测时间仅为29.8 ms。改进的YOLOv7模型能够为原棉杂质的实时检测和识别分类提供一种轻量化的检测方法,大幅节约了时间成本。

    前沿与综合应用
    基于高阶内模的变参考轨迹鲁棒迭代学习控制
    郑俊豪, 陶洪峰
    2024, 44(7):  2279-2284.  DOI: 10.11772/j.issn.1001-9081.2023070971
    摘要 ( )   HTML ( )   PDF (2195KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对一类带有非重复不确定参数的线性离散系统跟踪批次变化的参考轨迹问题,提出一种双环控制结构的鲁棒间接型迭代学习控制(ILC)算法。通过在内环部分设计比例-积分(PI)型反馈控制器保证闭环系统沿时间轴方向的稳定性,实现前几批次对参考轨迹的快速跟踪。在外环部分,通过高阶内模(HOIM)描述参考轨迹变化规律,并设计一个基于内模原理的高阶比例(P)型ILC控制器提升系统在批次方向上对变参考轨迹的跟踪性能,实现对变化的参考轨迹精确跟踪。针对不确定性参数带来的扰动问题,设计一类性能指标函数,将系统模型在间接型ILC控制器作用下转换为等价的重复过程模型;基于重复过程模型稳定性理论,将保证系统具有沿批次鲁棒稳定的性能指标条件转换为线性矩阵不等式(LMI)。最后通过一类永磁电机的控制仿真验证了所提算法的有效性。

    基于MPC和PID的脚轮式全向移动平台轨迹跟踪
    李华夏, 黄晓蓉, 沈安林, 蒋鹏, 彭忆强, 隋立起
    2024, 44(7):  2285-2293.  DOI: 10.11772/j.issn.1001-9081.2023071003
    摘要 ( )   HTML ( )   PDF (4693KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有运动控制策略无法保证独立驱动脚轮式全向移动平台位姿的高精度控制问题,提出一种基于模型预测控制(MPC)和PID控制相结合的双闭环轨迹跟踪控制策略。首先,利用运动学几何关系建立独立驱动脚轮式全向移动平台在世界坐标系下的三自由度运动学模型,基于正交分解法建立平台在机器人坐标系下的逆运动学模型,以反映平台中心点速度与各个脚轮转速间的关系;其次,采用MPC并基于三自由度运动学模型设计位姿控制器,使平台对期望轨迹进行位姿跟踪,并在考虑多目标约束条件的情况下通过位姿控制器求解出最优控制量;最后,采用PID设计速度控制器,用于跟踪位姿控制器输出的期望速度,通过平台逆运动学模型计算得到期望轮速,从而驱动平台实现全向运动。通过仿真验证了所提控制策略的有效性,平台能有效跟踪直线轨迹和圆形轨迹。仿真结果表明,与通过平台转角逆运动学模型解耦驱动轮速的位置单环轨迹跟踪控制策略相比,加入速度内环后系统超调量下降97.23%,响应时间缩短36.84%。

    侧滑和打滑下的轮式移动机器人轨迹跟踪控制
    胡映, 陈志环
    2024, 44(7):  2294-2300.  DOI: 10.11772/j.issn.1001-9081.2023070898
    摘要 ( )   HTML ( )   PDF (3498KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对未知侧滑和打滑干扰下轮式移动机器人(WMR)轨迹控制中,存在模型不确定性、外部干扰等扰动导致传统滑模控制易出现收敛精度不足、控制输入抖振的问题,提出一种基于非线性扩展状态观测器的自适应二阶滑模跟踪控制方法(ASOSMC-NESO)。首先建立了侧滑与打滑条件下的轮式移动机器人运动学和动力学模型;其次,由反步法设计运动学控制器,为动力学提供虚拟速度;接着,针对外部干扰设计了非线性扩展状态观测器,以估计总扰动;然后,基于二阶积分滑模的思想将积分滑模和非奇异快速终端滑模面相结合,设计了动力学控制器,并给出了控制器稳定性分析。实验结果表明,对比一阶滑模控制方法,该控制方法误差最大值在线性和非线性轨迹下,分别下降约89.53%和16.28%,而且控制输入基本不受干扰影响。由此可见,ASOSMC-NESO能有效提高WMR在未知侧滑和打滑下的控制精度,并有效削减抖振和提升WMR轨迹跟踪鲁棒性。

    基于U形多层感知机网络的地震波初至拾取与反演
    孙明皓, 余瀚, 陈雨青, 陆恺
    2024, 44(7):  2301-2309.  DOI: 10.11772/j.issn.1001-9081.2023060808
    摘要 ( )   HTML ( )   PDF (5608KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统勘探地震波初至拾取工作量大、抗噪性差和精度低所导致的低质量速度反演影响生产安全的问题,提出一种基于U形多层感知机(U-MLP)网络的地震波初至拾取与反演方法。首先,为解决传统U形网络(U-Net)中的交叉熵损失函数在数据类别不平衡时导致的性能变差问题,设计一种基于加权交叉熵Lovász归一化指数(WLS)的损失函数;然后,在特征融合阶段引入残差连接,缩小低级特征与高级特征间的差距,还原更多细节信息;最后,为使U-MLP网络更好学习图像局部特征,为高级语义引入标记化的多层感知机(MLP)模块,此模块降低了参数量和计算复杂度。实验结果表明,与U-Net相比,U-MLP网络在训练中收敛性更强,初至拾取最大误差降低了20%以上,交并比(IoU)值提升了约2%。可见,U-MLP网络在提取勘探地震波初至时不仅提高了拾取精度,而且拾取的初至在仿真数据和实际数据中的速度分布反演均达到了理想效果,具有更好的性能且适应性更强。

    基于密集残差物理信息神经网络的各向异性旅行时计算方法
    赵亦群, 张志禹, 董雪
    2024, 44(7):  2310-2318.  DOI: 10.11772/j.issn.1001-9081.2023070915
    摘要 ( )   HTML ( )   PDF (7009KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目前利用物理信息神经网络计算旅行时只是应用在各向同性介质上、在远离震源时误差较大和效率低等问题,而有限差分法、试射法和弯曲法等方法在多震源、高密度网格上计算成本高等问题,提出一种密集残差物理信息神经网络计算各向异性介质旅行时的方法。首先推导了各向异性因式分解后的程函方程作为损失函数项;其次引入局部自适应反正切函数为激活函数和L-BFGS-B(Limited-memory Broyden-Fletcher-Goldfarb-Shanno-B)作为优化器;最后在网络中采用分段式训练的方式,先训练深层密集残差网络,然后冻结其参数,再训练具有物理意义的浅层密集残差网络,从而评估网络得到旅行时。实验结果表明,所提方法在均匀速度模型下的旅行时最大绝对误差达到了0.015 8 μs,其他速度模型下平均绝对误差平均下降了两个数量级,在效率方面也平均提高了1倍,明显优于快速扫描法。

2024年 44卷 7期
刊出日期: 2024-07-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会