当期目录

    2023年 第43卷 第4期 刊出日期:2023-04-10
    人工智能
    多模态预训练模型综述
    王惠茹, 李秀红, 李哲, 马春明, 任泽裕, 杨丹
    2023, 43(4):  991-1004.  DOI: 10.11772/j.issn.1001-9081.2022020296
    摘要 ( )   HTML ( )   PDF (5539KB) ( )   PDF(mobile) (3280KB) ( 111 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    预训练模型(PTM)通过利用复杂的预训练目标和大量的模型参数,可以有效地获得无标记数据中的丰富知识。而在多模态中,PTM的发展还处于初期。根据具体模态的不同,将目前大多数的多模态PTM分为图像?文本PTM和视频?文本PTM;根据数据融合方式的不同,还可将多模态PTM分为单流模型和双流模型两类。首先,总结了常见的预训练任务和验证实验所使用的下游任务;接着,梳理了目前多模态预训练领域的常见模型,并用表格列出各个模型的下游任务以及模型的性能和实验数据比较;然后,介绍了M6(Multi-Modality to Multi-Modality Multitask Mega-transformer)模型、跨模态提示调优(CPT)模型、VideoBERT(Video Bidirectional Encoder Representations from Transformers)模型和AliceMind(Alibaba’s collection of encoder-decoders from Mind)模型在具体下游任务中的应用场景;最后,总结了多模态PTM相关工作面临的挑战以及未来可能的研究方向。

    基于自注意力网络的深度图匹配模型
    徐周波, 陈浦青, 刘华东, 杨欣
    2023, 43(4):  1005-1012.  DOI: 10.11772/j.issn.1001-9081.2022030345
    摘要 ( )   HTML ( )   PDF (2118KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有深度图匹配模型在节点特征提取阶段常利用图卷积网络(GCN)学习节点的特征表示。然而,GCN对节点特征的学习能力有限,影响了节点特征的可区分性,造成节点的相似性度量不佳,最终导致模型的匹配精度受损。为解决这一问题,提出一种基于自注意力网络的深度图匹配模型。所提模型在节点特征提取阶段使用新的自注意力网络来学习节点特征,其原理是通过空间编码器和自注意力机制分别学习节点的空间结构以及所有节点之间的联系,从而改善节点的特征描述。此外,为了减小放松图匹配问题所带来的精度损失,将图匹配问题建模为整数线性规划问题,在图匹配问题的节点匹配基础上增加结构匹配约束,以及引入高效的组合优化求解器来计算图匹配问题的局部最优解。实验结果表明,在PASCALVOC数据集上,与PCA-GM相比,所提模型在20类图像上的匹配精度平均值提高了14.8个百分点;在Willow Object数据集上,所提模型在5类图像上的匹配精度平均值提高了7.3个百分点,并且在自行车、植物等目标匹配任务上达到了最佳的效果。

    基于近邻监督局部不变鲁棒主成分分析的特征提取模型
    葛孟婷, 万鸣华
    2023, 43(4):  1013-1020.  DOI: 10.11772/j.issn.1001-9081.2022030329
    摘要 ( )   HTML ( )   PDF (1981KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对无监督的局部不变鲁棒主成分分析(LIRPCA)算法未考虑样本间的类别关系的问题,提出了一种基于近邻监督局部不变鲁棒主成分分析(NSLIRPCA)的特征提取模型。所提模型考虑了样本间的类别信息,并以此构建关系矩阵。对所提模型进行公式求解和公式的收敛性证明,并将所提模型应用于各种遮挡数据集。实验结果表明,在ORL、Yale、COIL-Processed和PolyU数据集上,与主成分分析(PCA)算法、基于L1范数的主成分分析(PCA-L1)算法、非负矩阵分解(NMF)算法、局部保持投影(LPP)算法和LIRPCA算法相比,所提模型在原始图像数据集上的识别率分别最高提升了8.80%、7.76%、20.37%、4.72%和4.61%,在遮挡图像数据集上的识别率分别最高提升了30.79%、30.73%、36.02%、19.65%和17.31%。可见,所提模型提高了算法的识别性能,降低了模型复杂度,明显优于对比算法。

    用户粒度级的个性化社交文本生成模型
    高永兵, 高军甜, 马蓉, 杨立东
    2023, 43(4):  1021-1028.  DOI: 10.11772/j.issn.1001-9081.2022030460
    摘要 ( )   HTML ( )   PDF (2546KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对开放性的社交文本领域的文本生成技术生成的文本内容缺少个性化特征的问题,提出了一种用户级的细粒度控制生成模型,即PTG-GPT2-Chinese(Personalized Text Generation Generative Pre-trained Transformer 2 -Chinese)。所提模型基于GPT2(Generative Pre-trained Transformer 2.0)结构设计了Encoder-Decoder模型框架。首先在Encoder端对用户的静态个性化信息建模并编码,在Decoder端添加了双向独立的注意力模块,用于接收该静态的个性化特征向量,并利用原始GPT2结构中的注意力模块捕获用户文本中的动态个性化特征;然后,动态加权融合各注意力模块分数并参与后续解码,从而自动生成以用户个性化特征属性作为约束的社交文本;此外,为了解决用户基本信息的语义稀疏性导致的生成文本偶尔与某些个性化特征存在矛盾的问题,采用BERT模型对Decoder端输出数据与用户个性化特征进行一致性理解的二次增强生成,最终实现个性化的社交文本生成。实验结果表明,与GPT2模型相比,所提模型的流畅度提高了0.36%~0.72%,且在不损失语言流畅度的基础上,二次生成使个性化和一致性两个评价指标分别提高了10.27%和13.24%。这验证了所提模型能够有效辅助用户创作,生成流畅且符合用户个性的社交文本。

    基于路径标签的文档级关系抽取方法
    袁泉, 徐雲鹏, 唐成亮
    2023, 43(4):  1029-1035.  DOI: 10.11772/j.issn.1001-9081.2022030327
    摘要 ( )   HTML ( )   PDF (1581KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对文档级关系抽取中文本处理复杂性过高,难以提取高效实体关系的问题,提出了一种基于路径标签的文档级关系抽取方法,抽取选择关键的证据句子。首先,引入路径(Path)标签代替实体句子作为处理过的文本数据集进行数据预处理;同时,结合语义分割的U-Net模型,利用输入端的编码模块捕获文档实体的上下文信息,并通过图像风格的U-Net语义分割模块捕获实体三元组之间的全局依赖性;最后,引入Softmax函数减少文本抽取时的噪声。理论分析和仿真结果表明,与基于图神经网络的RoBERTa(RoBERTa?ATLOP)关系抽取算法相比,Path+U-Net在基于文档级别的实体关系抽取数据集(DocRED)上的开发和测试的F1值分别提高了1.31、0.54个百分点,在化学疾病反应(CDR)数据集上的开发和测试的F1值分别提高了1.32、1.19个百分点;并且Path+U-Net在保证实体间的相关性与原始数据集的相关性一致的同时,对数据集的抽取成本更低、对文本的抽取精度更高。实验结果表明,所提出的基于路径标签的抽取方法能够有效提高长文本抽取效率。

    面向稠密检索的伪相关反馈方法
    胡文浩, 罗景, 涂新辉
    2023, 43(4):  1036-1042.  DOI: 10.11772/j.issn.1001-9081.2022030480
    摘要 ( )   HTML ( )   PDF (1463KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    伪相关反馈(PRF)机制是一种自动化的查询扩展(QE)技术,它利用原始查询和初次检索中前N篇文档蕴含的信息构建更加准确的查询,从而进一步提高信息检索系统的性能。但是,现有的面向稠密检索的PRF方法由于对文本的截断处理容易造成语义信息的缺失,而且在检索阶段的空间复杂度较高。针对上述问题,提出了一种基于段落级粒度且适用于长文本稠密检索的PRF方法Dense-PRF。首先,通过计算语义距离从初次检索的前N篇文档中获得相关段落的向量;其次,对相关段落向量进行平均池化以得到QE项向量;然后,按照权重结合原始查询向量和QE项向量构建新的查询向量;最后,根据新的查询向量得到最终检索结果。在Robust04和WT2G两个经典长文本测试集上将Dense-PRF与基线模型进行了对比实验,相较于模型RepBERT+BM25,Dense-PRF在前20篇文档的准确率和归一化折现累计效益(NDCG)指标上分别提升了1.66、1.32个百分点和2.30、1.91个百分点。实验结果表明Dense-PRF能有效缓解查询与文档词汇不匹配的问题,并提升检索精度。

    基于改进胶囊网络的会话型推荐模型
    孙浩, 曹健, 李海生, 毛典辉
    2023, 43(4):  1043-1049.  DOI: 10.11772/j.issn.1001-9081.2022040481
    摘要 ( )   HTML ( )   PDF (1960KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的会话型推荐模型难以从简短的会话中捕获项目之间的依赖关系的问题,在考虑了复杂的项目交互和动态的用户兴趣变化后,提出了一种基于会话型推荐的改进胶囊网络(SR-ECN)模型。首先,利用图神经网络(GNN)处理会话序列数据,以得到每个项目嵌入向量;然后,利用胶囊网络的动态路由机制,从交互历史中聚合高级用户的偏好;此外,所提模型引入自注意力网络进一步考虑用户和项目的潜在信息,从而为用户推荐更合适的项目。实验结果表明,在Yoochoose数据集上,所提模型的召回率和平均倒数排名(MRR)均优于SR-GNN(Session-based Recommendation with GNN)、TAGNN(Target Attentive GNN)等所有对比模型,与基于无损边缘保留聚合和快捷图注意力的推荐(LESSR)模型相比,所提模型的召回率和MRR分别提升了0.92和0.45个百分点,验证了改进胶囊网络对用户兴趣偏好提取的有效性。

    基于标签混淆的院前急救文本分类模型
    张旭, 生龙, 张海芳, 田丰, 王巍
    2023, 43(4):  1050-1055.  DOI: 10.11772/j.issn.1001-9081.2022020317
    摘要 ( )   HTML ( )   PDF (1907KB) ( )   PDF(mobile) (906KB) ( 5 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对院前急救文本专业词汇丰富、特征稀疏和标签混淆程度大等问题,提出一种基于标签混淆模型(LCM)的文本分类模型。首先,利用BERT获得动态词向量并充分挖掘专业词汇的语义信息;然后,通过融合双向长短期记忆(BiLSTM)网络、加权卷积和注意力机制生成文本表示向量,提高模型的特征提取能力;最后,采用LCM获取文本与标签间的语义联系、标签与标签间的依赖关系,从而解决标签混淆程度大的问题。在院前急救文本和公开新闻文本数据集THUCNews上进行实验,所提模型的F1值分别达到了93.46%和97.08%,相较于TextCNN(Text Convolutional Neural Network)、BiLSTM、BiLSTM-Attention等模型分别提升了0.95%~7.01%和0.38%~2.00%。实验结果表明,所提模型能够获取专业词汇的语义信息,更加精准地提取文本特征,并能有效解决标签混淆程度大的问题,同时具有一定的泛化能力。

    基于语法依存图的中文微博细粒度情感分类
    方澄, 李贝, 韩萍, 吴琼
    2023, 43(4):  1056-1061.  DOI: 10.11772/j.issn.1001-9081.2022030469
    摘要 ( )   HTML ( )   PDF (1598KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    情感分析能从用户言论中快速准确地挖掘用户的情感倾向,有着极大的应用市场。针对微博语言语法结构复杂多样的特性,提出了一种基于语法依存结构的图卷积神经网络(SGCN)模型对中文微博进行细粒度的情感分类。所提模型兼具结构表达和语义表达丰富的特点:基于词语间的依赖关系构建文本图,并通过点互信息(PMI)量化词语间的相关程度,作为相应边的权重以充分表现句子的结构信息;将融合位置信息的语义特征作为节点的初始特征,增加文本图中点的语义特征。为了验证所提模型的性能,在SMP2020(Social Media Processing 2020)微博情感分类数据集上,对两组包含开心、悲伤、愤怒、恐惧、惊讶和无情绪的6类微博情感数据进行了分析。实验结果表明,所提模型的平均F1分数可达到72.64%,相较于BERT(Bidirectional Encoder Representations from Transformers)词向量特征图卷积网络(BGCN)模型和文本级图神经网络(Text-Level-GNN)模型分别提高了2.75和3.87个百分点,验证了所提模型能更有效地利用句子的结构信息,提升模型的分类性能。

    基于Fastformer和自监督对比学习的实例分割算法
    高榕, 沈加伟, 邵雄凯, 吴歆韵
    2023, 43(4):  1062-1070.  DOI: 10.11772/j.issn.1001-9081.2022020270
    摘要 ( )   HTML ( )   PDF (3193KB) ( )   PDF(mobile) (4595KB) ( 13 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的实例分割算法对有遮挡以及模糊实例检测精度低、掩码较粗糙以及泛化能力弱的问题,提出一种基于Fastformer和自监督对比学习的实例分割算法。首先,在特征提取网络之后加入基于加性注意力的Fastformer模块,并对每一层特征图中的像素点之间的相互关系进行深入建模,以提高算法对特征图全局信息的提取能力;其次,受自监督学习启发,加入自监督对比学习模块对图像中的实例进行自监督对比学习,以提高算法对图像的理解能力,从而改善在噪声干扰较多的环境下的分割效果。在Cityscapes和COCO2017数据集上的实验结果表明,相较于近期经典的实例分割算法SOLOv2(Segmenting Objects by LOcations v2),所提算法的平均精度均值(mAP)分别提高了3.1和2.5个百分点,并在实时性和精度之间达到较好的平衡,在比较复杂的场景实例分割中具有较好的鲁棒性。

    不完备信息下基于切换推理证据网络的空中目标识别方法
    王昱, 范子琳, 任田君, 姬晓飞
    2023, 43(4):  1071-1078.  DOI: 10.11772/j.issn.1001-9081.2022020287
    摘要 ( )   HTML ( )   PDF (2178KB) ( )   PDF(mobile) (700KB) ( 7 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有证据推理方法模型结构固定、信息处理方式和推理机制单一,难以适用于集结了不确定、错误甚至缺失等多种不完备信息环境下的目标识别。针对该问题,提出了一种切换推理证据网络(SR-EN)方法。首先,考虑证据节点删除等情况构建多模板网络模型;然后,分析各证据变量与目标类型的条件关联性以建立针对不完备信息的推理规则库;最后,提出基于三种证据输入及修正方式的智能化时空融合推理方法。与传统的证据网络(EN)以及EN与优劣解距离法(TOPSIS)等两种信息修正方法的结合方法相比,SR-EN能够在确保推理时效性的同时实现在多类随机性不完备信息下对空中目标的连续准确识别。实验结果表明,通过对各类不完备信息的有效识别,SR-EN能够实现连续推理过程中证据处理方式、网络结构和节点间融合规则的自适应切换。

    数据科学与技术
    形式背景的内积约简
    王清, 高秀巍, 谢业海, 刘贵龙
    2023, 43(4):  1079-1085.  DOI: 10.11772/j.issn.1001-9081.2022030328
    摘要 ( )   HTML ( )   PDF (1082KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    形式概念分析是知识表示与挖掘的重要工具,而形式背景是形式概念分析中的基本概念之一。针对形式背景中对象集在给定属性集内是否拥有相同属性的问题,同时也为解决如何在计算中消除无关属性的问题,提出了新的属性约简类型,即内积约简。首先在形式背景中给出了内积概念;然后利用关系系统的约简理论和方法定义内积约简,并提出了基于差别矩阵的内积约简算法,以得到形式背景下的全部约简,在此基础上,通过交运算可以得到约简核;当属性增加时,设计了增量内积约简算法。最后结合传染病网络探索内积约简的应用,在模拟案例中属性数量从6个约简到2个。模拟结果表明,内积约简具有可行性和可解释性,达到了知识约简目的。

    基于Lasso和构造性覆盖算法的不均衡数据分类方法
    蒋溢, 伍书平, 胡昆, 龙林波
    2023, 43(4):  1086-1093.  DOI: 10.11772/j.issn.1001-9081.2022040490
    摘要 ( )   HTML ( )   PDF (1003KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对机器学习分类算法在不均衡数据分类问题中对少数类样本识别能力不足的问题,以电信客户流失场景为例,提出一种不均衡数据分类方法L-CCSmote(Lasso Constructive Covering Smote)。首先,通过套索回归(Lasso)提取流失用户特征以优化模型输入;然后,通过构造性覆盖算法(CCA)建立神经网络生成符合样本整体分布的覆盖;最后,进一步提出单样本覆盖策略、样本多样性策略和样本密度峰值策略,通过以上策略混合采样以平衡数据。选用了KEEL数据库中的13个不均衡数据集和2个脱敏电信客户数据集,分别在逻辑回归(LR)和支持向量机(SVM)分类算法上对该方法进行验证。在LR分类算法上,与SMOTE-Enn(Synthetic Minority Oversampling TEchnique Edited nearest neighbor)相比,所提方法的平均几何平均值(G-MEAN)提升了2.32%;在SVM分类算法上,与Borderline-SMOTE(Borderline Synthetic Minority Oversampling Technique Edited)相比,所提方法的平均G-MEAN提升了2.44%。实验结果表明,所提方法能解决类别偏斜分布影响分类的问题,且对于稀有类的识别能力优于经典平衡数据方法。

    基于生成对抗网络的数据不确定性量化方法
    王昊, 王子成, 张超, 马韵升
    2023, 43(4):  1094-1101.  DOI: 10.11772/j.issn.1001-9081.2022030383
    摘要 ( )   HTML ( )   PDF (2018KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对直接使用高维、高频、含有噪声的现实世界数据进行数据处理时会导致估计器不可靠的问题,提出一种基于生成对抗网络(GAN)的数据不确定性量化方法。首先,通过GAN重构原始数据分布,构建噪声空间到原始数据空间的映射分布;其次,使用马尔可夫链蒙特卡洛(MCMC)方法抽取样本,从而得到基于原始数据分布的新样本;然后,基于指定的函数定义样本的不确定性置信区间;最后,使用置信区间对原始数据进行不确定性估计,并选择置信区间内的数据作为估计器使用的数据。实验结果表明,与使用原始数据相比,使用置信区间内的数据进行估计器训练达到性能上限所需要的样本数减少了50%;同时,对比原始训练数据,置信区间内的数据在达到相同测试精度时所需要的样本数平均降低了30%。

    基于可审计多副本的云存储差错副本恢复机制
    谢振杰, 付伟
    2023, 43(4):  1102-1108.  DOI: 10.11772/j.issn.1001-9081.2022030477
    摘要 ( )   HTML ( )   PDF (1642KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对具备可审计特性的多副本云存储系统的差错副本恢复问题,在多副本云存储完整性审计方案的基础上,从总体流程、影响因素、恢复策略、故障定位和计算模型5个方面阐述差错副本恢复机制,将差错副本恢复策略归纳为全副本下载上传、全副本差值上传、故障块上传和故障段上传4种,并对影响恢复效率的因素进行了量化,提出通信开销、计算开销和总开销的计算模型。针对一个具体的多副本云存储完整性审计方案,对不同策略和参数下纠正一个数据块随机差错的开销进行量化分析。实验结果表明,当带宽分别为1 Mb/s、10 Mb/s、100 Mb/s和1 Gb/s时,实验中最优策略的耗时分别只有全副本差值上传策略的0.34%、2.44%、15.27%和46.93%。可见所提模型可用于为可审计多副本云存储系统选择合适的策略与参数,以提高差错副本恢复效率,尤其适用于网络带宽受限的情况。

    基于改进的局部结构熵复杂网络重要节点挖掘
    李鹏, 王世林, 陈光武, 闫光辉
    2023, 43(4):  1109-1114.  DOI: 10.11772/j.issn.1001-9081.2022040562
    摘要 ( )   HTML ( )   PDF (1367KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    识别复杂网络中的关键节点对优化网络结构以及信息的有效传播起着至关重要的作用。局部结构熵(LE)利用局部网络对整个网络的影响代替节点对整个网络的影响以识别重要节点,然而LE未考虑高聚集性网络和节点与邻居节点形成环的情况,存在一定的局限性。针对以上不足,首先,提出了改进LE的节点重要性评价方法PLE(Penalized Local structural Entropy),即在LE的基础上引入集聚系数(CC)作为惩罚项,从而适当惩罚网络中的高聚集性节点;其次,由于PLE的惩罚项对三元闭包结构上的节点惩罚力度过大,又提出了PLE的改进方法PLEA(Penalized Local structural Entropy Advancement),即在惩罚项前引入一个控制系数,以控制惩罚力度。对5个不同规模的真实网络进行选择性攻击实验,实验结果表明,在美国西部各州电网和美国航空网两个网络中,与LE方法相比,PLEA的识别准确率分别提升了26.3%和3.2%;与K-Shell(KS)方法相比,PLEA的识别准确率分别提升了380%和5.43%;与DCL(Degree and Clustering coefficient and Location)方法相比,PLEA的识别准确率分别提升了14.4%和24%。同时,PLEA识别的重要节点对网络造成的破坏更大,验证了引入CC作为惩罚项的合理性,以及PLEA的有效性和优越性。PLEA综合考虑了节点的邻居个数和节点的局部网络结构,计算简单,对于刻画大规模网络的可靠性与抗毁性具有十分重要的意义。

    基于用户动态交互行为扩展的信念网络推荐模型
    鲍彩倩, 徐建民, 张国防
    2023, 43(4):  1115-1121.  DOI: 10.11772/j.issn.1001-9081.2022020279
    摘要 ( )   HTML ( )   PDF (1378KB) ( )   PDF(mobile) (1068KB) ( 5 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有推荐方法证据组合方式单一,未能同时考虑准确性和多样性的问题,提出基于用户动态交互行为扩展的信念网络推荐模型(EBNR_UDIB)。首先,构建一个具有3层结构的基本信念网络推荐(BNR)模型,从而为证据的引入提供一个灵活有效的框架;其次,通过分析用户间的直接及耦合交互关系计算交互强度,并引入动态调整的时间衰减因子修订该强度;最后,以该强度对交互用户加权,将该用户的兴趣作为新证据扩展基本模型,并利用合取和析取两种证据组合方式得到EBNR_UDIB。实验结果表明,相较于基于内容的推荐模型(CBRM)和基于社交的推荐模型(SBRM),在准确率、召回率和F1值上,合取组合方式下的所提模型分别至少提升了7、4和5个百分点,析取组合方式下的所提模型分别至少提升了2、8和6个百分点;在多样性和新颖性指标上,析取组合方式下的所提模型分别至少提升了15和6个百分点,合取组合方式下的所提模型也优于对比模型。

    基于自适应群组重排的长尾推荐模型
    金苍宏, 邵育华, 何琴芳
    2023, 43(4):  1122-1128.  DOI: 10.11772/j.issn.1001-9081.2022030455
    摘要 ( )   HTML ( )   PDF (1249KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统推荐算法过度关注推荐的精度而导致的长尾问题,即热门项目拥有过高的推荐量的同时非热门项目长时间不被关注,提出一种基于欧氏距离构建二维加权相似度并融入自适应群组重排的多目标优化推荐模型(MDOM)——自适应群组重排的推荐模型(AGRM)。首先,利用欧氏距离构建二维加权相似度度量,根据个体历史行为记录动态设定替换比例,并利用融入群组的多目标优化算法解决长尾推荐问题;其次,设计两个简明的目标函数,并同时考虑流行度和长尾关注度,以降低目标函数的复杂性;然后,基于二维加权相似度度量,选择用户子集作为“最佳推荐用户组”,并计算帕累托最优解。在MovieLens 1M和Yahoo数据集上的实验结果表明,AGRM的覆盖率表现最优,与基于物品相似的协同过滤(ItemCF)算法相比,分别平均提升了4.11、25.38个百分点;与用于Top-N推荐的具有浅并行路径的深度变分自动编码器(VASP)模型相比,分别平均提升了8.38、33.19个百分点。在Yahoo数据集上,AGRM的推荐的平均流行度最低,表明AGRM能够推荐更多长尾项目。

    基于时间序列分解的交通流量预测模型
    夏进, 王正群, 朱世明
    2023, 43(4):  1129-1135.  DOI: 10.11772/j.issn.1001-9081.2022030473
    摘要 ( )   HTML ( )   PDF (2485KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    短时交通流预测不仅与历史数据相关,而且也受相邻区域交通情况影响。针对传统时间序列分解(TSD)模型忽略交通流的趋势性和空间相关性的问题,提出了基于时间序列分解与时空特征(TSD-ST)结合的时间序列处理模型。首先,利用经验模态分解(EMD)和离散傅里叶变换(DFT)得到趋势分量和周期分量,利用互信息(MI)算法挖掘波动分量的时空(ST)相关性,并以此为根据重构状态向量;随后,通过长短期记忆(LSTM)网络利用状态向量对波动分量进行预测;最后,将序列的3部分的预测结果重构,得到最终预测值。利用美国华盛顿州I090号州际公路的真实数据验证模型的有效性。实验结果表明,与支持向量回归(SVR)、梯度提升回归树(GBRT)、LSTM相比,所提模型的均方根误差(RMSE)分别降低了16.5%、34.0%和36.6%。由此可见,所提模型在提升预测精度方面十分有效。

    图结构表示下的药物数据增强方法
    蔡引江, 许光俊, 马喜波
    2023, 43(4):  1136-1141.  DOI: 10.11772/j.issn.1001-9081.2022040489
    摘要 ( )   HTML ( )   PDF (1966KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    小样本数据会导致机器学习模型出现过拟合问题,而药物研发中的数据往往都具有小样本特性,这极大地限制了机器学习技术在该领域的应用。针对上述问题,提出了图结构下的药物数据增强方法。所提方法通过对样本微扰生成新的相似样本,以扩充数据集。所提方法包含4个子方法,分别是:基于分子骨干的节点丢弃法、基于分子骨干的边丢弃法、多样本拼接法以及混合策略法。其中,基于分子骨干的节点丢弃和边丢弃法通过少量删减药物分子的组成与结构完成对药物分子的微扰;多样本拼接法则使用一种增添性操作,通过组合不同分子完成微扰;混合策略法按一定比例配比删减性和增添性操作提升数据增强结果的多样性。在公开数据集BACE、BBBP、ToxCast和ClinTox上,所提方法为药物属性预测基线模型MG-BERT(Molecular Graph Bidirectional Encoder Representations from Transformer)的受试者工作特征曲线下面积(AUC)带来了1.94%~12.49%的提升。实验结果验证了所提方法在小样本药物数据增强上的有效性。

    网络空间安全
    零信任网络及其关键技术综述
    王群, 袁泉, 李馥娟, 夏玲玲
    2023, 43(4):  1142-1150.  DOI: 10.11772/j.issn.1001-9081.2022030453
    摘要 ( )   HTML ( )   PDF (2001KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在网络安全威胁日趋严峻、安全防御手段日益复杂的情况下,零信任网络能够对传统边界安全架构进行全新的评估和审视。零信任强调不要永远信任,而且要持续验证,而零信任网络不以位置标识身份,所有访问控制严格执行最小权限,所有访问过程被实时跟踪和动态评估。首先,给出了零信任网络的基本定义,指出了传统边界安全暴露出的主要问题,并描述了零信任网络模型;其次,分析了软件定义边界(SDP)、身份和访问管理、微隔离、自动配置管理系统(ACMS)等零信任网络中的关键技术;最后,对零信任网络进行了总结,并展望未来发展。

    面向加密流量分类的深度可解释方法
    崔剑, 麻开朗, 孙钰, 王豆, 周君良
    2023, 43(4):  1151-1159.  DOI: 10.11772/j.issn.1001-9081.2022030382
    摘要 ( )   HTML ( )   PDF (3314KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前的深度学习模型在加密流量分类任务上相较于传统机器学习方法的性能优势显著,然而由于它固有的黑盒特性,用户无法获知深度学习模型作出分类决策的机理。为了在保证分类准确率的同时提高深度学习模型的可信度,提出一种面向加密流量分类深度学习模型的可解释方法,包括基于原型的流量层级主动解释和基于特征相似显著图的数据包层级被动解释。首先,利用基于原型的流量原型网络(FlowProtoNet),在训练时自动提取各类流量的典型片段,即流量原型;其次,在测试时计算出待测流量与各类原型的相似度,从而在分类的同时实现训练集的溯源解释;然后,为进一步提升可视化解释能力,提出梯度加权的特征相似度显著图(Grad-SSM)方法。Grad-SSM首先通过梯度对特征图加权,过滤分类决策无关区域;接着,计算待测流量与FlowProtoNet提取的原型之间的推土机距离(EMD)得到相似矩阵,从而通过比较测试流量与该类原型,实现注意力热图的进一步聚焦。在ISCX VPN-nonVPN数据集上,所提方法的准确率达到96.86%,与不可解释的人工智能方法持平,而FlowProtoNet能通过给出与原型的相似度,进一步提供分类依据;同时,所提方法的可视化解释能力更强,注意力更聚焦于流量中的关键数据包。

    基于个性化差分隐私的联邦学习算法
    尹春勇, 屈锐
    2023, 43(4):  1160-1168.  DOI: 10.11772/j.issn.1001-9081.2022030337
    摘要 ( )   HTML ( )   PDF (1800KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    联邦学习(FL)可以有效保护用户的个人数据不被攻击者获得,而差分隐私(DP)则可以实现FL的隐私增强,解决模型训练参数导致的隐私泄露问题。然而,现有的基于DP的FL方法只关注统一的隐私保护预算,而忽略了用户的个性化隐私需求。针对此问题,提出了一种两阶段的基于个性化差分隐私的联邦学习(PDP-FL)算法。在第一阶段,依据用户的隐私偏好对用户隐私进行分级,并添加满足用户隐私偏好的噪声,以实现个性化隐私保护,同时上传隐私偏好对应的隐私等级给中央聚合服务器;在第二阶段,为实现对全局数据的充分保护,采取本地和中心同时保护的策略,并根据用户上传的隐私等级,添加符合全局DP阈值的噪声,以量化全局的隐私保护水平。实验结果表明,在MNIST和CIFAR-10数据集上,PDP-FL算法的分类准确度分别为93.8%~94.5%和43.4%~45.2%,优于基于本地化差分隐私的联邦学习(LDP-Fed)和基于全局差分隐私的联邦学习(GDP-FL),同时满足了个性化隐私保护的需求。

    基于高效联邦学习算法的网络入侵检测模型
    郝劭辰, 卫孜钻, 马垚, 于丹, 陈永乐
    2023, 43(4):  1169-1175.  DOI: 10.11772/j.issn.1001-9081.2022020305
    摘要 ( )   HTML ( )   PDF (1650KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为解决在入侵检测场景中引入联邦学习技术后,由于节点间存在流量数据非独立同分布(non-iid)现象而导致模型难以聚合并得到高识别率的问题,构造了一种高效联邦学习算法(H-E-Fed),并基于该算法构建了对应的入侵检测模型。首先,协调方设计针对流量数据的全局模型,并下发至入侵检测节点间进行模型训练;然后,协调方收集本地模型,并对节点间本地模型的协方差矩阵评估偏度,以衡量节点间模型的相关性,从而重新分配模型聚合参数,并生成新的全局模型;最后,协调方与节点多轮交互,直至全局模型收敛。实验结果表明,与基于联邦平均(FedAvg)算法和FedProx算法的模型相比,基于高效联邦学习算法的入侵检测模型在节点间产生数据non-iid现象时的通信消耗更低;且在KDDCup99数据集和CICIDS2017数据集上,与基线模型相比,准确率分别提升了10.39%、8.14%与4.40%、5.98%。

    异构备份网络的病毒传播模型及稳定性分析
    李映岐, 姬伟峰, 翁江, 吴玄, 申秀雨, 孙岩
    2023, 43(4):  1176-1182.  DOI: 10.11772/j.issn.1001-9081.2022030409
    摘要 ( )   HTML ( )   PDF (2043KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对云计算、数据中心等基于虚拟网络的环境中病毒二次攻击的问题,研究了平台动态防御背景下的病毒传播及免疫机理,并提出一种异构备份式的网络病毒防御方法。首先,分析冗余备份发生二次攻击的过程,并总结病毒作用规律;同时,结合平台动态防御的思想,引入异构平台状态节点,并提出了易感?潜伏?感染?免疫?异构?易感(SEIRHS)病毒传播模型;其次,运用劳斯?赫尔维茨稳定性判据证明了模型平衡点处的局部稳定性,并求解基本再生数;最后,通过实验仿真分析对比了所提模型与传统易感?感染?免疫(SIR)模型、易感?潜伏?感染?免疫(SEIR)模型,并验证了所提模型的稳定性,探讨了病毒传播影响因子对病毒扩散规模的作用结果。仿真结果表明,所提模型能客观反映病毒在网络中的传播规律,并通过降低节点度、提高感染?异构(I-H)状态转移概率、降低备份时已被病毒潜伏的概率等有效提升网络对病毒的防御效果。

    基于CFL的工控系统认证通信方案
    兰松柏, 李方晓, 石乐义
    2023, 43(4):  1183-1190.  DOI: 10.11772/j.issn.1001-9081.2022030451
    摘要 ( )   HTML ( )   PDF (1990KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对工控系统(ICS)中广泛采用的中心认证方案所存在的密钥泄露、单点失效、通信开销大的问题,将具有国内自主知识产权的密码基础逻辑(CFL)认证技术引入ICS的认证与通信过程中,并提出一种基于CFL的ICS认证通信方案。首先,通信双方通过交换并验证基于彼此身份标识和权限信息所生成的动态含权证书,实现双方身份的去中心认证和会话密钥的协商;然后,通过会话密钥、CFL动态签名和访问控制规则保证双方的安全通信;最后,将控制过程详细日志进行加密存储,以实现可溯源过程。理论分析和实验结果表明,所提方案在身份验证阶段不再需要远程认证中心的参与,并实现了工控设备间的本地高效认证。在面对大量认证请求时,与公钥基础设施(PKI)方案、基于身份加密(IBE)方案相比,所提方案的系统吞吐量分别至少提升了92.53%和141.37%,意味着所提方案能够更好地满足ICS的大规模认证和毫秒级安全通信的需求。

    基于光线投射采样和四元数正交矩的高效三维医学影像鲁棒零水印算法
    高健, 李智, 樊缤, 姜传贤
    2023, 43(4):  1191-1197.  DOI: 10.11772/j.issn.1001-9081.2021050746
    摘要 ( )   HTML ( )   PDF (2206KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对三维医学影像的版权保护问题,以及随着待保护图像数量增加而导致的水印存储容量同步增加的问题,提出了一种基于光线投射采样和极复指数矩的三维医学影像鲁棒性零水印算法。首先,提出了一种基于光线投射的采样算法,对多张二维医学图像序列构成的三维医学影像进行特征采样并在二维图像空间中进行描述;其次,提出了一种针对三维医学影像的鲁棒性零水印算法,所提算法通过光线投射采样获取三维医学影像的冠状面、矢状面和横切面的3个二维特征图像,将3个二维特征图像进行极复指数变换获得四元数正交矩;最后,使用四元数正交矩和Logistic混沌加密构建零水印信息。仿真实验结果表明,在各种常见的图像处理攻击和几何攻击下所提算法能够保持零水印提取的比特正确率在0.920 0以上,水印存储容量随着三维医学影像的数据增多而提升,与其他优秀的二维医学图像零水印算法相比,所提算法的存储容量至少提升了93.75%。

    先进计算
    概率故障条件下k元(n-m)方体子网络的可靠性
    冯凯, 刘彤
    2023, 43(4):  1198-1205.  DOI: 10.11772/j.issn.1001-9081.2022030414
    摘要 ( )   HTML ( )   PDF (894KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    kn方体具有许多优良特性,已成为多处理器系统最常用的互连网络拓扑结构之一。当系统互连网络中发生故障时,系统子网络的保持能力对系统实际应用至关重要。为了精确度量kn方体中任意规模子网络的容错能力,研究了有故障发生时kn方体中k元(n-m)方体子网络的可靠性。当kk≥3)为奇整数时,在概率故障条件下得出了kn方体中存在无故障k元(n-m)方体子网络的概率的上界和下界,并给出了该可靠性的一种近似评估方法。实验结果表明,随着顶点可靠性的降低,k元(n-m)方体子网络可靠性的上下界趋于一致;当顶点可靠性较高时,利用近似评估方法得出的结果更为准确。

    计算机软件技术
    基于自适应混合粒子群优化的软件缺陷预测特征选择方法
    于振华, 刘争气, 刘颖, 郭城
    2023, 43(4):  1206-1213.  DOI: 10.11772/j.issn.1001-9081.2022030444
    摘要 ( )   HTML ( )   PDF (1910KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    特征选择是软件缺陷预测中数据预处理的关键步骤。针对现有特征选择方法存在的降维效果不显著、选取的最优特征子集分类精度低等问题,提出了一种基于自适应混合粒子群优化(SHPSO)的软件缺陷预测特征选择方法。首先,结合种群划分设计了基于Q学习的自适应权重更新策略,其中引入Q学习根据粒子的状态自适应地调整惯性权重;其次,为了平衡算法前期的全局搜索能力和后期的收敛速度,提出了基于曲线自适应的时变学习因子;最后,采用混合位置更新策略帮助粒子尽快跳出局部最优解,并增加粒子的多样性。在12个公开软件缺陷数据集上进行实验验证的结果表明,与使用全部特征的方法、常用的传统特征选择方法及主流的基于智能优化算法的特征选择方法相比,所提方法在提高软件缺陷预测模型分类性能和降低特征空间维度上均取得了有效的结果。与改进樽海鞘群算法(ISSA)相比,所提方法的分类精度平均提高了约1.60%,特征子集规模平均降低了约63.79%。实验结果表明,所提方法可以选出分类精度较高且数量较少的特征子集。

    求解测试用例自动生成问题的多因子回溯搜索优化算法
    胡中波, 王旭鹏
    2023, 43(4):  1214-1219.  DOI: 10.11772/j.issn.1001-9081.2022030393
    摘要 ( )   HTML ( )   PDF (1135KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    路径覆盖测试用例自动生成(ATCG-PC)问题是自动化软件测试领域的热点。ATCG-PC问题中群智能进化算法常用的适应度函数之间具有高度的相似性,然而现有的解决ATCG-PC问题的群智能进化算法尚未考虑这一相似性特征。受相似性特征启发,将两个相似的适应度函数看作两个任务,从而将ATCG-PC问题转化为多任务ATCG-PC问题,并提出了一种新的解决多任务ATCG-PC问题的群智能进化算法,即多因子回溯搜索优化算法(MFBSA)。所提算法通过多因子选择Ⅰ的记忆种群功能提高全局搜索能力,并通过选型记忆交配使得相似任务之间能够通过知识转移提高彼此的优化效率。在6个雾计算测试程序和6个自然语言处理测试程序上对所提算法性能进行了评价。与回溯搜索优化算法(BSA)、免疫遗传算法(IGA)、收敛速度控制器粒子群优化(PSO-CSC)算法、自适应粒子群优化(APSO)算法和超立方体差分进化(DE-H)算法相比,MFBSA覆盖12个测试程序上的路径所使用的测试用例总数分别减少了64.46%、66.64%、67.99%、74.15%和61.97%。实验结果表明,所提算法能够有效降低测试成本。

    多媒体计算与计算机仿真
    动态环境下结合实例分割与聚类的鲁棒RGB-D SLAM系统
    肖田邹子, 周小博, 罗欣, 唐其鹏
    2023, 43(4):  1220-1225.  DOI: 10.11772/j.issn.1001-9081.2022020261
    摘要 ( )   HTML ( )   PDF (2537KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    视觉同步定位与建图(VSLAM)技术常常用于室内机器人的导航与感知,然而VSLAM的位姿估算方法是针对静态环境的,当场景中存在运动对象时,可能会导致定位和建图失败。针对此问题,提出了一个结合实例分割与聚类的VSLAM系统。所提系统使用实例分割网络生成场景中动态对象的概率掩膜,同时利用多视图几何的方法检测场景中的动态点,并将检测到的动态点与获得的概率掩膜匹配之后确定动态物体的精确动态掩膜;利用动态掩膜删除动态物体的特征点,然后利用剩余的静态特征点准确估计摄像机的位置。为了解决实例分割网络欠分割的问题,采用深度填充算法和聚类算法保证动态特征点完全删除。最后,重建图片被动态物体遮挡的背景,在正确的相机位姿下建立静态稠密点云地图。在公开的TUM(Technical University of Munich)数据集上的实验结果表明,在动态环境中,所提系统在保证实时性的同时能实现鲁棒的定位与建图。

    保持细节几何特征的三维网格模型轻量化算法
    张韵, 王淑营, 郑庆, 张海柱
    2023, 43(4):  1226-1232.  DOI: 10.11772/j.issn.1001-9081.2022030434
    摘要 ( )   HTML ( )   PDF (3119KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    对三维模型进行轻量化的一个重要策略是利用网格简化算法减少模型表面的三角面片数量,其中广泛使用的边折叠算法相较于其他网格简化算法效率更高、简化效果更好,然而该算法存在简化过程中可能损坏或丢失部分细节几何特征的问题。为了解决上述问题,提出通过增加曲线近似曲率和模型待折叠边的一阶邻域三角形的平均面积作为惩罚因子,以优化原始算法的边折叠代价。首先,根据几何中曲线曲率的定义,提出了曲线近似曲率的计算公式;其次,在顶点法向量的计算过程中,使用面积加权和内角加权两个阶段对初始法向量进行修正,从而考虑更加丰富的模型几何信息。通过实验验证了优化后算法的性能,与经典的二次误差测度(QEM)算法、顾及角度误差的网格简化算法相比,优化算法处理后的模型的最大误差分别至少降低了73.96%和49.77%;与QEM算法相比,优化算法处理后的模型Hausdorff距离至少降低了17.69%。可见,在模型轻量化的过程中,优化算法能够减少模型的形变,更好地维持自身的细节几何特征。

    基于信息熵的流场定向线积分卷积算法
    李梦依, 方霞, 郑红波, 秦绪佳
    2023, 43(4):  1233-1239.  DOI: 10.11772/j.issn.1001-9081.2022030391
    摘要 ( )   HTML ( )   PDF (4496KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    流场可视化是对流场数据进行直观分析的一种新的可视化技术,而定向线积分卷积(OLIC)算法作为一种经典的纹理可视化方法,使用该算法能明显地观察出流场方向流动的演化。为了优化可视化效果,提出了一种基于信息熵的OLIC算法。首先,基于流场矢量数据生成基于信息熵的稀疏噪声;然后,采用斜坡卷积核函数对输入纹理进行卷积计算;最后,通过计算输出纹理图像中每一个像素点的灰度值,得到最终的OLIC纹理图像。所提算法可以根据熵值在临界点区域和非临界点区域自适应地生成流线。其中临界点区域含有流场的重要信息,选择密集绘制;而在非临界点区域则选择稀疏绘制。通过在不同区域绘制不同密度的流线,所提算法节省了计算成本;与普通OLIC算法相比,所提算法的绘制速度至少提升了18.6%;在可视化效果方面,所提算法优于普通的全局绘制,使用所提算法能更仔细地观察特征区域。

    结合注意力的双分支残差低光照图像增强
    祖佳贞, 周永霞, 陈乐
    2023, 43(4):  1240-1247.  DOI: 10.11772/j.issn.1001-9081.2022030479
    摘要 ( )   HTML ( )   PDF (4669KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在低光条件下拍摄的照片会因曝光不足而产生一系列的视觉问题,如亮度低、信息丢失、噪声和颜色失真等。为了解决上述问题,提出一个结合注意力的双分支残差低光照图像增强网络。首先,采用改进InceptionV2提取浅层特征;其次,使用残差特征提取块(RFB)和稠密残差特征提取块(DRFB)提取深层特征;然后,融合浅层和深层特征,并将融合结果输入亮度调整块(BAM)调整亮度,最终得到增强图像。同时,结合注意力机制设计特征融合块(FFM)捕获重要的特征信息,以帮助恢复低光照图像的暗部区域。此外,引入一个联合损失函数从多方面衡量网络训练损失。实验结果表明,相较于鲁棒的视网膜大脑皮层模型(RRM)、Zero-DCE(Zero-Reference Deep Curve Estimation)和EnlightenGAN(Enlighten Generative Adversarial Network),在LOL(LOw-Light)数据集上,所提网络的峰值信噪比(PSNR)指标分别提高了49.9%、40.0%和18.5%;在LOL-V2数据集上,结构相似性(SSIM)指标分别提高了20.3%、50.0%和34.5%。所提网络在提高低光照图像亮度的同时降低了噪声,减少了颜色失真和伪影,得到的增强图像更加清晰自然。

    基于注意力自相关机制的跟踪外观特征
    窦光义, 魏发南, 邱创一, 巢建树
    2023, 43(4):  1248-1254.  DOI: 10.11772/j.issn.1001-9081.2022030426
    摘要 ( )   HTML ( )   PDF (2258KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了解决多目标跟踪(MOT)算法中由于模糊行人特征造成的身份切换(IDS)等跟踪问题,并验证行人外观在跟踪过程中的重要性,提出了一种基于中心点检测模型的注意力自相关网络(ASCN)。首先,对原图进行通道和空间注意力网络的学习以获得两种不同的特征图,并对深度信息完成解耦;然后,通过特征图之间的自相关性学习,获得更加准确的行人外观特征和行人方位信息,并将这些信息用于关联过程的跟踪;此外,制作了低帧率条件下视频的跟踪数据集,以验证改进算法的性能。在视频帧率条件不理想时,改进算法利用ASCN获取了行人外观信息,相较于仅利用方位信息的跟踪算法具有更好的准确率和鲁棒性。最后,将改进算法在MOT Challenge的MOT17数据集上进行测试。实验结果表明,与不加入ASCN的FairMOT(Fairness in MOT)相比,改进算法的跟踪平均准确率(MOTA)和识别F值(IDF1)指标分别提高了0.5和1.1个百分点,IDS数减少了32.2%,且在单卡NVIDIA Tesla V100上的运行速度达到了每秒21.2帧,这验证了改进算法不仅减少了跟踪过程中的错误,也提升了整体跟踪效果,且能够满足实时性要求。

    面向机械臂操作的视觉信息实时重建方法
    贾清玉, 常亮, 杨先一, 强保华, 张世豪, 谢武, 杨明浩
    2023, 43(4):  1255-1260.  DOI: 10.11772/j.issn.1001-9081.2022020262
    摘要 ( )   HTML ( )   PDF (2136KB) ( )   PDF(mobile) (1418KB) ( 6 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现阶段的机械臂技能传授方法主要通过三维实时重建技术搭建虚拟空间进行模拟训练。然而人与机械臂视角不同,传统视觉信息重建方法由于重建误差大、时间长,而且实验环境苛刻、所需传感器较多等原因,导致机械臂在虚拟空间内习得的技能不能很好地迁移于现实环境。针对以上问题,提出了一种面向机械臂操作的视觉信息实时重建方法。首先,通过Mask-RCNN(Mask-Region Convolutional Neural Network)对实时采集到的RGB图像提取信息;然后,将提取后的RGB图像及其他视觉信息联合编码,并通过ResNet-18将视觉信息映射为机械臂操作空间的三维位置信息;最后,为减小重建误差,提出了一种聚类簇中心距离受限离群值调整方法(CC-DIS),并利用OpenGL(Open Graphics Library)将调整后的位置信息可视化,完成机械臂操作空间三维实时重建。实验结果表明,所提的实时重建方法具有较快的重建速度和较高的重建精度,完成一次三维重建仅需62.92 ms,重建速度高达每秒16帧,重建相对误差约为5.23%,能有效用于机械臂技能传授任务。

    基于残差图卷积神经网络的高倍欠采样核磁共振图像重建算法
    樊小宇, 蔺素珍, 王彦博, 刘峰, 李大威
    2023, 43(4):  1261-1268.  DOI: 10.11772/j.issn.1001-9081.2022020309
    摘要 ( )   HTML ( )   PDF (2569KB) ( )   PDF(mobile) (2309KB) ( 4 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    磁共振成像(MRI)因其无创伤和较高的软组织对比度而被广泛地用于复杂疾病诊断。目前多通过在k空间高倍欠采样磁共振(MR)信号解决MRI速度较慢的问题,然而代表性算法重建高倍欠采样的MR图像时往往存在细节模糊的问题。因此,提出一种基于残差图卷积神经网络(RGCNET)的高倍欠采样MR图像重建算法。首先,使用自编码技术与图卷积神经网络(GCN)构建生成器;其次,将欠采样图像输入特征提取(编码)网络中从底层提取特征;接着,通过GCN块提取MR图像的高层特征;然后,通过解码网络生成初始的重建图像;最后,经过生成器和鉴别器的动态博弈得到最终的高分辨率重建图像。在FastMRI数据集上的测试结果表明,与基于空间正交注意力机制的MRI重建算法SOGAN(Spatial Orthogonal attention Generative Adversarial Network)相比,在10%、20%、30%、40%和50%的采样率下,所提算法在标准均方根误差(NRMSE)指标上分别下降了3.5%、26.6%、23.9%、13.3%和14.3%,在峰值信噪比(PSNR)指标上分别提升了1.2%、8.7%、6.9%、2.9%和3.2%,而结构相似性(SSIM)指标上分别提升了0.8%、2.9%、1.5%、0.5%和0.5%。同时,主观观察也验证了所提算法能保留更多细节和取得更逼真的视觉效果。

    引入门控轴向自注意力的多通道病理图像分割
    陈志, 李歆, 林丽燕, 钟婧, 时鹏
    2023, 43(4):  1269-1277.  DOI: 10.11772/j.issn.1001-9081.2022030333
    摘要 ( )   HTML ( )   PDF (4014KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在苏木精?伊红(HE)染色病理图像中,细胞染色分布的不均匀和各类组织形态的多样性给自动化分割带来了极大挑战。针对传统卷积无法捕获大邻域范围内像素间的关联特征,导致分割效果难以进一步提升的问题,提出引入门控轴向自注意力的多通道分割网络(MCSegNet)模型,以实现病理图像细胞核的精准分割。所提模型采用双编码器和解码器结构,在其中使用轴向自注意力编码通道捕获全局特征,并使用基于残差结构的卷积编码通道获取局部精细特征;在编码通道末端,通过特征融合增强特征表示,从而为解码器提供良好的信息基础;而解码器通过级联多个上采样模块逐步生成分割结果。此外,使用改进的混合损失函数有效解决了病理图像中普遍存在的样本不均衡问题。在MoNuSeg2020公开数据集上的实验结果表明,改进的分割方法比U-Net在F1、交并比(IoU)指标上分别提升了2.66个百分点、2.77个百分点,有效改善了病理图像的分割效果,提高了临床诊断的可靠性。

    医用内窥镜图像的高光移除算法
    池月, 李正平, 徐超, 冯博
    2023, 43(4):  1278-1283.  DOI: 10.11772/j.issn.1001-9081.2022030478
    摘要 ( )   HTML ( )   PDF (2907KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的内窥镜图像高光移除算法往往存在移除结构不合理、颜色失真等情况,而这会导致病灶识别算法和图像增强算法产生错误的结果。为了解决以上问题,在高光定位方面,提出了一种基于暗区域内生长和Scharr 滤波结合的相对高光定位方法;在高光填充方面,提出了一种改进的Crinminisi算法。首先,通过统计大量数据,限定搜索范围,从而提高填充效率;其次,改进优先权统计范围,以避免重复的无意义的计算;最后,针对不同区域的自适应模板,合理重建纹理。在选取不同人体组织的内窥镜图像数据集上进行实验,相较于基于双色反射模型的方法、自适应鲁棒主成分分析(RPCA)方法、基于热扩散的方法和原始Criminisi算法,所提算法的自然图像质量评估(NIQE)值均为最小;相较于RPCA方法、基于热扩散的方法和原始Crimnisi算法,所提算法的运行时间也均为最少。实验结果表明,所提算法不仅比其他算法具有更好的客观图像指标,而且相较于原始Criminisi算法在效率上有近百倍的提升。

    引入Ghost模块和ECA的YOLOv4公路路面裂缝检测方法
    郝巨鸣, 杨景玉, 韩淑梅, 王阳萍
    2023, 43(4):  1284-1290.  DOI: 10.11772/j.issn.1001-9081.2022030410
    摘要 ( )   HTML ( )   PDF (5654KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目前公路路面裂缝种类和尺度多样导致路面病害检测困难的问题,提出一种基于GhostNet的轻量化无人机图像裂缝检测方法检测不同种类路面裂缝。首先,引入轻量级GhostNet中的Ghost模块优化YOLOv4主干特征提取网络,得到轻量化模型YOLOv4-Light,以降低模型复杂度,并提高裂缝检测速度;然后,在模型预测输出端融合高效通道注意力(ECA)机制,从而进一步增强裂缝特征提取能力,提高裂缝检测精度。仿真实验结果表明,所提方法与现有的YOLOv4相比,模型大小降低了82.31%,模型参数量减少了82.56%,并提高了裂缝检测效率,能够满足公路运输过程中出现的不同类型的裂缝检测需求。

    基于改进YOLOv5s电动车头盔的自动检测与识别
    朱周华, 齐琦
    2023, 43(4):  1291-1296.  DOI: 10.11772/j.issn.1001-9081.2022020313
    摘要 ( )   HTML ( )   PDF (2941KB) ( )   PDF(mobile) (3142KB) ( 52 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目前电动车头盔小目标检测的精度低、鲁棒性差,相关系统不完善等问题,提出了基于改进YOLOv5s的电动车头盔检测算法。所提算法引入卷积块注意力模块(CBAM)和协调注意力(CA)模块,采用改进的非极大值抑制(NMS),即DIoU-NMS(Distance Intersection over Union-Non Maximum Suppression);同时增加多尺度特征融合检测,并结合密集连接网络改善特征提取效果;最后,建立了电动车驾驶人头盔检测系统。在自建的电动车头盔佩戴数据集上,当交并比(IoU)为0.5时,所提算法的平均精度均值(mAP)比原始YOLOv5s提升了7.1个百分点,召回率(Recall)提升了1.6个百分点。实验结果表明,所提改进的YOLOv5s算法更能满足在实际情况中对电动车及驾驶员头盔的检测精度要求,一定程度上降低了电动车交通事故的发生率。

    基于注意力机制编码器解码器的手写数学公式识别模型
    陈路, 陈道喜, 陆一鸣, 陆卫忠
    2023, 43(4):  1297-1302.  DOI: 10.11772/j.issn.1001-9081.2022020278
    摘要 ( )   HTML ( )   PDF (1695KB) ( )   PDF(mobile) (993KB) ( 17 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的手写数学公式识别(HMER)方法经过卷积神经网络(CNN)多次池化后,图像分辨率降低、特征信息丢失,从而引起解析错误的问题,提出基于注意力机制编码器?解码器的HMER模型。首先,采用稠密卷积网络(DenseNet)作为编码器,使用稠密连接加强特征提取,促进梯度传播,并缓解梯度消失;其次,采用门控循环单元(GRU)作为解码器,并引入注意力机制,将注意力分配到图像的不同区域,从而准确地实现符号识别和结构分析;最后,对手写数学公式图像进行编码,将编码结果解码为LaTeX序列。在在线手写数学公式识别竞赛(CROHME)数据集上的实验结果表明,所提模型的识别率提升到40.39%,而在3个级别的允许误差范围内,识别率分别提升到52.74%、58.82%和62.98%。相较于双向长短期记忆(BLSTM)网络模型,所提模型的识别率提高了3.17个百分点;而在3个级别的允许误差范围内,识别率分别提高了8.52、11.56和12.78个百分点。可见,所提模型能够准确地解析手写数学公式图像,生成LaTeX序列,提升识别率。

    基于渐进比率掩蔽目标的自适应噪声估计方法
    高建清, 屠彦辉, 马峰, 付中华
    2023, 43(4):  1303-1308.  DOI: 10.11772/j.issn.1001-9081.2022030384
    摘要 ( )   HTML ( )   PDF (1425KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于深度学习的语音增强算法的性能通常优于传统的基于噪声抑制的语音增强算法。然而当训练数据和测试数据之间存在不匹配时,基于深度学习的语音增强算法通常无法正常工作。针对上述问题,提出一种新的基于渐进比率掩蔽(PRM)的自适应噪声估计(PRM-ANE)方法,并把它作为语音识别系统的预处理方法。所提方法综合利用了具有帧级别的噪声跟踪能力的改进最小统计量控制递归平均(IMCRA)算法和具有学习噪声和语音之间复杂非线性映射关系的渐进学习算法这两种算法。首先,使用二维卷积神经网络(2D-CNN)学习随信噪比(SNR)增加的PRM;其次,通过传统的帧级语音增强算法组合句子级估计的PRM,进行语音增强;最后,将基于多级别信息融合的增强语音直接作为语音识别系统的输入,从而提高识别系统性能。在CHiME-4真实测试集上的实验结果表明,所提方法可以实现7.42%的相对字识别错误率(WER),与IMCRA语音增强方法相比下降了51.41%,可见所提方法能够有效提升下游识别任务的性能。

    前沿与综合应用
    大宗商品防欺诈抗篡改线上交易机制
    王亦涵, 唐晨, 张兰
    2023, 43(4):  1309-1317.  DOI: 10.11772/j.issn.1001-9081.2022040546
    摘要 ( )   HTML ( )   PDF (2395KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    大宗商品线上交易面临由交易欺诈、交接违规等问题带来的巨大风险。为实现更加可信的大宗商品交易,提出一套长期可追溯的线上交易机制,以实现信息的真实防篡改、流程的可信抗欺诈。首先,基于“申请?验证?记录”的思想,结合区块链提出线上交易框架,并利用智能合约实现对交易流程各阶段的多方监督和详细记录;其次,基于局部二值模式(LBP)算法对外观上具有纹理特征的大宗商品的商品外观指纹进行提取和核验,从而保障商品信息的真实性;最后,基于环境指纹,提出商品规范交接方法,以保证交接流程的可信性。上述交易框架、商品外观指纹提取及核验算法、商品规范交接方法共同构成了防欺诈抗篡改的线上交易机制。分析结果表明,该交易框架能够从用户选择和流程规范两个角度规避大部分的欺诈,且识别交易中发生的单方和两方欺诈行为;基于真实原木图像数据的实验结果表明,所提商品外观指纹提取及核验算法能够以94.00%的准确率判断同一商品的不同图像,并以78.30%的准确率区分不同商品的图像;系统性能测试表明,所提交易机制各阶段的时延均在可接受范围内,满足线上交易要求。

    基于卷积长短时深度神经网络的信号调制方式识别方法
    杨海宇, 郭文普, 康凯
    2023, 43(4):  1318-1322.  DOI: 10.11772/j.issn.1001-9081.2022030425
    摘要 ( )   HTML ( )   PDF (2318KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对信号调制方式识别计算复杂度高、低信噪比(SNR)条件下识别率较低、网络结构相对单一的问题,提出一种基于卷积长短时深度神经网络(CLDNN)的信号调制方式识别方法。首先,采用基准开源数据集RadioML2016.10a,对该数据集做同相正交(I/Q)数据转换,并将得到的结果作为网络输入;其次,构建CLDNN模型,模型分为三层卷积神经网络(CNN)、两层长短期记忆(LSTM)网络和两层全连接网络(FCN);最后,对所提模型进行训练及测试,得到分类结果。实验结果表明,对11种信号在不同SNR下进行调制方式识别时,与现有的单一网络结构模型如残差神经网络(RES)模型、CNN模型和残差生成对抗网络(RES-GAN)模型进行对比,随着SNR的提升,CLDNN模型的识别准确率也随之提高,且CLDNN模型的识别准确率均高于其他3种对比模型,当SNR在4 dB以上时,达到了92%。

2025年 45卷 4期
刊出日期: 2025-04-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会