《计算机应用》唯一官方网站

面向超图的极大团搜索算法

徐兰天, 李荣华, 戴永恒, 王国仁

2023, 43(8): 2319-2324. DOI: 10.11772/j.issn.1001-9081.2022091334

摘要 ( )

HTML ( )

PDF (1332KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现实世界中的实体关系大多不能用简单的二元关系来表示，而超图能很好地表示实体间的多元关系。因此，提出超图团和极大团的定义，并给出了搜索超图极大团的精确算法和近似算法。首先，分析了现有的普通图上的极大团搜索算法无法直接应用到超图上的原因。然后，基于超图的特性和极大团的定义，提出了一种新颖的保存超点间邻接关系的数据结构，并提出了一种超图上的精确极大团搜索算法。由于精确算法的速度较慢，因此结合支撑点（pivot）的剪枝思想，削减递归层数，提出了一种超图上的近似极大团搜索算法。在多个真实超图数据集上的实验结果显示，所提近似算法在找到大多数极大团的前提下，提高了搜索速度，当在3-uniform超图上，测试超图团的点数为22时，加速比达到了1 000以上。

基于孪生网络的小样本目标检测算法

姜钧舰, 刘达维, 刘逸凡, 任酉贵, 赵志滨

2023, 43(8): 2325-2329. DOI: 10.11772/j.issn.1001-9081.2022121865

摘要 ( )

HTML ( )

PDF (1472KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

基于深度学习的目标检测算法如YOLO（You Only Look Once）和Faster R-CNN（Faster Region-Convolutional Neural Network）需要大量训练数据以保证模型的精度，而在很多场景下获取数据以及标注数据的成本较高；并且由于缺少海量的训练数据，导致检测的范围受限。针对以上问题，提出了一种基于孪生网络的小样本目标检测算法（SiamDet），旨在使用少量标注图像训练具有一定泛化能力的目标检测模型。首先，提出了基于深度可分离卷积的孪生网络，并使用深度可分离卷积设计了特征提取网络ResNet-DW，从而解决了样本不充足带来的过拟合问题；其次，基于孪生网络，提出了目标检测算法SiamDet，并在ResNet-DW的基础上，引入区域建议网络（RPN）来定位感兴趣目标；然后，引入二值交叉熵损失进行训练，并使用对比训练策略，从而增加了类别之间的区分度。实验结果表明，SiamDet在小样本条件下具有良好的目标检测能力，且相较于次优的算法DeFRCN（Decoupled Faster R-CNN），SiamDet在MS-COCO数据集20-way 2-shot和PASCAL VOC数据集5-way 5-shot上的AP₅₀分别增加了4.1%和2.6%。

面向视频数据的时空伴随模式挖掘算法

张潇誉, 于自强, 刘承栋, 李博涵, 靖常峰

2023, 43(8): 2330-2337. DOI: 10.11772/j.issn.1001-9081.2022101566

摘要 ( )

HTML ( )

PDF (5225KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

时空伴随模式是具有时空伴随关系的视频对象组合。为了从海量视频数据中快速发现符合查询条件的时空伴随模式，提出一种基于三重剪枝匹配策略的时空伴随模式发现算法——MPA。首先，利用已有的视频对象识别和跟踪模型对视频对象进行结构化提取；然后，对提取的连续帧中大量重复出现的视频对象进行压缩存储并构建索引；最后，设计基于前缀树的时空伴随模式发现算法，以快速发现符合查询条件的时空伴随模式。在真实数据集和合成数据集上的实验结果表明，与暴力搜索算法（BFA）相比，所提算法的效率提高了30%左右，且数据量越大，效率提高越明显。因此，所提算法能够快速发现海量视频数据中满足查询条件的时空伴随模式。

双路自编码器的属性网络表示学习

王静红, 周志霞, 王辉, 李昊康

2023, 43(8): 2338-2344. DOI: 10.11772/j.issn.1001-9081.2022091337

摘要 ( )

HTML ( )

PDF (956KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

属性网络表示学习的目的是在保证网络中节点性质的前提下，结合结构和属性信息学习节点的低维稠密向量表示。目前属性网络表示学习方法忽略了网络中属性信息的学习，且这些方法中的属性信息与网络拓扑结构的交互性不足，不能高效融合网络结构和属性信息。针对以上问题，提出一种双路自编码器的属性网络表示学习（DENRL）算法。首先，通过多跳注意力机制捕获节点的高阶邻域信息；其次，设计低通拉普拉斯滤波器去除高频信号，并迭代获取重要邻居节点的属性信息；最后，构建自适应融合模块，通过结构和属性信息的一致性及差异性约束来增加对重要信息的获取，并通过监督两个自编码器的联合重构损失函数训练编码器。在Cora、Citeseer、Pubmed和Wiki数据集上的实验结果表明，与DeepWalk、ANRL（Attributed Network Representation Learning）等算法相比，DENRL算法在3个引文网络数据集上聚类准确率最高、算法运行时间最少，在Cora数据集上聚类准确率为0.775和运行时间为0.460 2 s；且DENRL算法在Cora和Citeseer数据集上链路预测精确率最高，分别达到了0.961和0.970。可见，属性与结构信息的融合及交互学习可以获得更强的节点表示能力。

基于多阶段搜索的约束多目标进化算法

徐赛娟, 裴镇宇, 林佳炜, 刘耿耿

2023, 43(8): 2345-2351. DOI: 10.11772/j.issn.1001-9081.2022091355

摘要 ( )

HTML ( )

PDF (1529KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有约束多目标进化算法的约束处理策略无法有效解决具有大型不可行区域的问题，导致种群停滞在不可行区域的边缘；此外，约束条件下的不连续问题对算法的全局搜索能力以及多样性的维持提出了更高的要求。针对上述问题，提出了一种基于多阶段搜索的约束多目标进化算法（CMOEA-MSS），在该算法的3个阶段采用不同的搜索策略。为使种群快速穿越大型不可行区域并逼近Pareto前沿，所提算法在第一阶段不考虑约束条件，利用一种收敛性指标引导种群搜索；在第二阶段采用一组均匀分布的权重向量来维持种群的多样性，并提出一种改进的epsilon约束处理策略，以保留不可行区域中的高质量解；在第三阶段采用约束优先原则，将搜索偏好集中在可行区域以保证最终解集的可行性。CMOEA-MSS与NSGA-Ⅱ+ARSBX（Nondominated Sorting Genetic Algorithm Ⅱ using Adaptive Rotation-based Simulated Binary crossover）等算法在MW和DASCMOP测试集上对比的结果表明：在MW测试集上，CMOEA-MSS在7个测试问题上获得了最好的IGD（Inverted Generational Distance）值，在5个测试问题上获得了最好的HV（HyperVolume）值；在DASCMOP测试集上，CMOEA-MSS在3个测试问题上获得了最好的IGD值，在2个测试问题上取得了次好的IGD值，在5个测试问题上获得了最好的HV值。可见，CMOEA-MSS在处理不连续以及具有多模态性质的约束多目标问题时具有明显优势。

基于随机游走算法的频谱组合拍卖机制

王菁怡, 李超, 宋衡, 李迪, 朱俊武

2023, 43(8): 2352-2357. DOI: 10.11772/j.issn.1001-9081.2022091351

摘要 ( )

HTML ( )

PDF (1187KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

如何将频谱有效地分配给用户并提高提供商的收益是目前研究的热点。针对频谱组合拍卖中提供商收益低的问题，结合用户估值分布不对称的特点，设计了基于随机游走的频谱组合拍卖（RWSCA）机制，以最大化频谱提供商的收益。首先引入了虚拟估值的思想，用随机游走算法在参数空间搜索一组最优参数，并根据参数线性映射买家的估值；然后运行基于虚拟估值的VCG （Vickrey-Clarke-Groves）机制，从而确定赢得拍卖的用户并计算相应的支付金额。理论分析证明了所提机制具有激励相容和个体理性的性质。在频谱组合拍卖仿真实验中，相较于VCG机制，RWSCA机制至少提高16.84%以上提供商收益。

面向个性化课程推荐的分层分期注意力网络模型

刘源, 董永权, 贾瑞, 杨昊霖

2023, 43(8): 2358-2363. DOI: 10.11772/j.issn.1001-9081.2022091336

摘要 ( )

HTML ( )

PDF (979KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着大规模在线开放课程（MOOC）平台的广泛使用，需要一种有效的方法为用户推荐个性化课程。针对现有的课程推荐方法通常利用课程学习记录为用户的学习兴趣建立整体的静态表示，但忽略了学习兴趣动态变化与用户短期学习兴趣的问题，提出一种分层分期的注意力网络（HPAN）进行个性化课程推荐。该网络的第1层利用注意力网络得到用户的长短期学习兴趣，第2层将用户的长短期学习兴趣和短期交互序列相结合并通过注意力网络得到用户的兴趣向量；然后计算用户兴趣向量与每个课程向量的偏好值，据此为用户进行课程推荐。在XuetangX（学堂在线）公开数据集上的实验结果表明，与次优的序列分层注意力网络（SHAN）模型相比，HPAN模型的Recall@5提高了12.7%，与FPMC（Factorizing Personalized Markov Chains）模型相比，它的MRR@20提高了15.6%。HPAN模型的推荐效果优于对比模型，可解决实际的个性化课程推荐。

基于多层语义融合的结构化深度文本聚类模型

马胜位, 黄瑞章, 任丽娜, 林川

2023, 43(8): 2364-2369. DOI: 10.11772/j.issn.1001-9081.2022091356

摘要 ( )

HTML ( )

PDF (1642KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

近年来，由于图神经网络（GNN）的结构信息在机器学习中的优势，人们开始将GNN结合进深度文本聚类中。当前结合GNN的深度文本聚类算法在文本语义信息融合时忽略了解码器在语义补足上的重要作用，这导致在数据生成部分出现语义信息的缺失。针对以上问题，提出了一种基于多层语义融合的结构化深度文本聚类模型（SDCMS）。该模型利用GNN将结构信息集成到解码器中，通过逐层语义补充增强了文本数据的表示，并通过三重自监督机制获得更好的网络参数。在Citeseer、Acm、Reutuers、Dblp、Abstract 这5个真实数据集上进行实验的结果表明，与目前最优的注意力驱动的图形聚类网络（AGCN）模型相比，SDCMS在准确率、归一化互信息（NMI）和平均兰德指数（ARI）上分别最多提升了5.853%、9.922%和8.142%。

深度动态文本聚类模型DDDC

陆辉, 黄瑞章, 薛菁菁, 任丽娜, 林川

2023, 43(8): 2370-2375. DOI: 10.11772/j.issn.1001-9081.2022091354

摘要 ( )

HTML ( )

PDF (1962KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

互联网的飞速发展使得新闻数据呈爆炸增长的趋势。如何从海量新闻数据中获取当前热门事件的主题演化过程成为文本分析领域研究的热点。然而，常用的传统动态聚类模型处理大规模数据集时灵活性差且效率低下，现有的深度文本聚类模型则缺乏一种通用的方法捕捉时间序列数据的主题演化过程。针对以上问题，设计了一种深度动态文本聚类（DDDC）模型。该模型以现有的深度变分推断算法为基础，可以在不同时间片上捕捉融合了前置时间片内容的主题分布，并通过聚类从这些分布中获取事件主题的演化过程。在真实新闻数据集上的实验结果表明，在不同的数据集上，与动态主题模型（DTM）、变分深度嵌入（VaDE）等算法相比，DDDC模型在各时间片的聚类精度均至少提升了4个百分点，且归一化互信息（NMI）至少提高了3个百分点，验证了DDDC模型的有效性。

面向热点新闻事件的层次化故事脉络生成方法

刘东, 林川, 任丽娜, 黄瑞章

2023, 43(8): 2376-2381. DOI: 10.11772/j.issn.1001-9081.2022091377

摘要 ( )

HTML ( )

PDF (1333KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

热点新闻事件的发展十分丰富，各个阶段的发展都有其独特的叙述，并且随着事件的发展呈现出层次化故事脉络演化的趋势。针对现有故事脉络生成方法存在脉络可解释性不佳以及缺乏层次性的问题，提出一种面向热点新闻事件的层次化故事脉络生成方法（HSGM）。首先，采用改进热词算法来挑选主干种子事件，以构建主干脉络；其次，挑选分支事件热词以增强分支可解释性；然后，在分支脉络中采用融合热词关联度与动态时间惩罚的脉络连贯度挑选策略来增强父子事件的连接，以构建层次化热词，进而构建多层次故事脉络；此外，考虑到热点新闻事件存在潜伏期，在脉络构建过程加入孵化池以解决因热度不够所产生的初始事件被忽略问题。在两个自建真实数据集上进行实验的结果表明，在事件追踪过程中，与分别基于singlePass和基于k-means的方法相比，HSGM的F值分别高出了4.51%、6.41%和20.71%、13.01%；而在脉络构建过程中，与Story Forest和Story Graph相比，HSGM在两个自建数据集上的准确性、可理解性、完整性方面表现良好。

基于改进领域分离网络的迁移学习模型

金泽熙, 李磊, 刘继

2023, 43(8): 2382-2389. DOI: 10.11772/j.issn.1001-9081.2022071103

摘要 ( )

HTML ( )

PDF (1973KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为进一步提高迁移学习的特征识别和提取效率、减少负迁移并增强模型的学习性能，提出了一种基于改进领域分离网络（DSN）的迁移学习模型AMCN-DSN（Attention Mechanism Capsule Network-DSN）。首先，使用融合多头注意力机制的胶囊网络（MHAC）完成源域和目标域特征信息的提取与重构，基于注意力机制有效筛选特征信息，并利用胶囊网络提高深层信息的提取质量；其次，引入动态对抗因子优化重构损失函数，使重构器可动态衡量源域与目标域信息的相对重要性，从而增强迁移学习的鲁棒性和提升收敛速度；最后，在分类器中融入多头自注意力机制，以强化对公有特征的语义理解并提高分类性能。在情感分析实验中，相较于其他迁移学习模型，所提模型能够将学习到的知识迁移到数据量少但相似性高的任务中，分类性能的下降幅度最小，迁移表现较好；在意图识别实验中，相较于分类性能次优的胶囊网络改进领域对抗神经网络（DANN+CapsNet）模型，所提模型的精确度、召回率和F1值分别提升了4.5%、4.3%和4.4%，表明所提模型在处理小数据问题和个性化问题上具有一定优势。与DSN相比，AMCN-DSN在上述两类实验目标域上的F1值分别提高了6.0%和12.4%，进一步验证了改进模型的有效性。

基于表达式的逐层聚合和动态选择的图到方程树模型

刘斌, 张倩, 魏亚琴, 崔学英, 智红英

2023, 43(8): 2390-2395. DOI: 10.11772/j.issn.1001-9081.2022071054

摘要 ( )

HTML ( )

PDF (2057KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有树解码器仅适合求解单变量问题而求解多元问题的效果欠佳，而大多数数学求解器对真值表达式的错误选择导致训练出现学习偏差。针对上述问题，提出基于表达式的逐层聚合和动态选择的图到方程树（GET）模型。首先，通过图编码器学习文本语义；其次，从方程树的底层开始逐层迭代地聚合数量和未知变量以得到子表达式；最后，结合输出表达式的最长前缀动态地选择真值表达式以实现偏差最小化。实验结果表明，所提模型在Math23K数据集上的精度达到83.10%，相较于图到树（Graph2Tree）模型提升了5.70个百分点。可见，所提模型适用于复杂多元数学问题的求解，并能降低学习偏差对实验结果的影响。

融合注意力和裁剪机制的通用文本分类模型

崔雨萌, 王靖亚, 刘晓文, 闫尚义, 陶知众

2023, 43(8): 2396-2405. DOI: 10.11772/j.issn.1001-9081.2022071071

摘要 ( )

HTML ( )

PDF (1774KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对当前分类模型通常仅对一种长度文本有效，而在实际场景中长短文本大量混合存在的问题，提出了一种基于混合神经网络的通用型长短文本分类模型（GLSTCM-HNN）。首先，利用BERT（Bidirectional Encoder Representations from Transformers）对文本进行动态编码；然后，使用卷积操作提取局部语义信息，并构建双通道注意力机制（DCATT）对关键文本区域增强；同时，使用循环神经网络（RNN）捕获全局语义信息，并建立长文本裁剪机制（LTCM）来筛选重要文本；最后，将提取到的局部和全局特征进行融合降维，并输入到Softmax函数里以得到类别输出。在4个公开数据集上的对比实验中，与基线模型（BERT-TextCNN）和性能最优的对比模型（BERT）相比，GLSTCM-HNN的F1分数至多分别提升了3.87和5.86个百分点；在混合文本上的两组通用性实验中，GLSTCM-HNN的F1分数较已有研究提出的通用型模型——基于Attention的改进CNN-BiLSTM/BiGRU混联文本分类模型（CBLGA）分别提升了6.63和37.22个百分点。实验结果表明，所提模型能够有效提高文本分类任务的准确性，并具有在与训练数据长度不同的文本上以及在长短混合文本上分类的通用性。

基于句级别GAN的跨语言零资源命名实体识别模型

张小艳, 段正宇

2023, 43(8): 2406-2411. DOI: 10.11772/j.issn.1001-9081.2022071124

摘要 ( )

HTML ( )

PDF (963KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对低资源语言缺少标签数据，而无法使用现有成熟的深度学习方法进行命名实体识别（NER）的问题，提出基于句级别对抗生成网络（GAN）的跨语言NER模型——SLGAN-XLM-R（Sentence Level GAN Based on XLM-R）。首先，使用源语言的标签数据在预训练模型XLM-R （XLM-Robustly optimized BERT pretraining approach）的基础上训练NER模型；同时，结合目标语言的无标签数据对XLM-R模型的嵌入层进行语言对抗训练；然后，使用NER模型来预测目标语言无标签数据的软标签；最后，混合源语言与目标语言的标签数据，以对模型进行二次微调来得到最终的NER模型。在CoNLL2002和CoNLL2003两个数据集的英语、德语、西班牙语、荷兰语四种语言上的实验结果表明，以英语作为源语言时，SLGAN-XLM-R模型在德语、西班牙语、荷兰语测试集上的F1值分别为72.70%、79.42%、80.03%，相较于直接在XLM-R模型上进行微调分别提升了5.38、5.38、3.05个百分点。

知识增强的方面词交互图神经网络

衡红军, 杨鼎诚

2023, 43(8): 2412-2419. DOI: 10.11772/j.issn.1001-9081.2022071041

摘要 ( )

HTML ( )

PDF (1210KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的方面级情感分析方法对句法依存树蕴含信息使用不足，忽略多方面词之间的关联，并且缺少对外部知识的使用。针对这些问题，提出一种知识增强的方面词交互图神经网络（KEAIG）模型。首先利用融合领域知识的BERT-PT （Bidirectional Encoder Representation from Transformers with Post-Train）编码文本，并利用知识图谱增加句法树的情感信息。模型分两部分对句法依存树蕴含的信息进行提取：第一部分利用句法依存树中的关联关系和每个单词的词性标签提取句子特征，第二部分对融入知识图谱的句法依存树进行特征提取。之后使用融合门控单元将多方面词关联特征融合进提取到的特征中。最后将两部分句子表示拼接起来作为最终分类依据。在4个数据集上的实验结果表明，所提模型相较于基准模型关系图注意力网络（RGAT），在准确率上分别提升了2.17%、5.54%、2.60%和2.83%，在F1值（Macro?F1）上分别提升了2.69%、6.87%、8.77%和14.70%，充分表明了利用句法树、引入外部知识和提取多方面词关联的有效性。

融合知识图谱和图注意力网络的引文推荐算法

樊海玮, 鲁芯丝雨, 张丽苗, 安毅生

2023, 43(8): 2420-2425. DOI: 10.11772/j.issn.1001-9081.2022071110

摘要 ( )

HTML ( )

PDF (1853KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统协同过滤（CF）中的数据稀疏和冷启动问题，以及元路径、随机游走算法没有充分利用节点信息的问题，提出融合知识图谱和图注意力网络的引文推荐算法（C-KGAT）。首先，使用TransR算法将知识图谱信息映射为低维稠密向量，以获取节点的嵌入特征表示；其次，利用图注意力网络通过多通道融合机制聚合邻居节点信息以丰富目标节点的语义，并捕获节点间高阶连通性；接着，在不影响网络的深度或宽度的情况下，引入动态卷积层动态地聚合邻居节点信息以提升模型的表达能力；最后，通过预测层计算用户和引文的交互概率。在公开数据集AAN（ACL Anthology Network）和计算机科学文献库（DBLP）上的实验结果表明，所提算法的效果优于所有对比模型，所提算法的MRR（Mean Reciprocal Rank）相较于次优模型NNSelect分别提升了6.0和3.4个百分点，所提算法的精确率和召回率指标也有不同程度的提升，验证了算法的有效性。

基于负训练和迁移学习的关系抽取方法

陈克正, 郭晓然, 钟勇, 李振平

2023, 43(8): 2426-2430. DOI: 10.11772/j.issn.1001-9081.2022071004

摘要 ( )

HTML ( )

PDF (922KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

远程监督是关系抽取任务中常用的数据自动标注方法，然而该方法会引入大量的噪声数据，从而影响模型的表现效果。为了解决噪声数据的问题，提出一种基于负训练和迁移学习的关系抽取方法。首先通过负训练的方法训练一个噪声数据识别模型；然后根据样本的预测概率值对噪声数据进行过滤和重新标注；最后利用迁移学习的方法解决远程监督存在的域偏移问题，从而进一步提升模型预测的精确率和召回率。以唐卡文化为基础，构建了具有民族特色的关系抽取数据集。实验结果表明，所提方法的F1值达到91.67%，相较于SENT（Sentence level distant relation Extraction via Negative Training）方法，提升了3.95个百分点，并且远高于基于BERT（Bidirectional Encoder Representations from Transformers）、BiLSTM+ATT（Bi-directional Long Short-Term Memory And Attention）、PCNN（Piecewise Convolutional Neural Network）的关系抽取方法。

轻量级缓存策略的关系型数据库全文搜索加强与扩展

杨婷, 莫若玉, 张秀娟, 朱洲森

2023, 43(8): 2431-2438. DOI: 10.11772/j.issn.1001-9081.2022071108

摘要 ( )

HTML ( )

PDF (1891KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对关系型数据库（RDB）现有的全文搜索方案存在的效率低下、资源占用高的问题，提出一种具有增强式辅助缓存的轻量级关系型数据库全文搜索模型。首先，该模型构建基于Redis的倒排索引，并利用缓存索引缩小搜索范围，从而用内存高效的数据处理能力解决关系型数据库I/O瓶颈，并提升系统整体性能；其次，为保证搜索结果的准确性和时效性，进一步提出索引同步策略，而且设计并实现了增量索引组件来隐藏索引处理细节，从而提高模型的易用性和通用性；最后，对于热点数据提供一种基于访问热度的索引更新机制，以降低倒排索引的内存占用。实验结果表明，所提模型在保证关系型数据库全文搜索响应速度和准确度的前提下，空间资源消耗比MySQL全文索引降低了48.8%~60.9%，比Elasticsearch降低了85.2%~96.2%，证明所提模型在实际应用中可行且有效。

基于消极相似性的自适应社会化推荐

周寅莹, 周允升, 余敦辉, 孙军

2023, 43(8): 2439-2447. DOI: 10.11772/j.issn.1001-9081.2022071003

摘要 ( )

HTML ( )

PDF (3245KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

社会化推荐旨在融合社会关系改善传统推荐算法的推荐效果。当前基于网络嵌入（NE）的社会化推荐算法面临两个问题：一是在构建网络时未考虑对象间的不一致性，并且倾向于利用获取难度大、约束条件多的积极对象来约束算法；二是这些算法未能依据评分数量消除算法训练中的过拟合。因此，提出一种基于消极相似性的自适应社会化推荐（ASRNS）算法。首先通过一致性分析构建具有正向相关性的同构网络；接着联合加权随机游走与Skip-Gram算法得到嵌入向量；然后计算相似度，并从消极相似性的角度来约束矩阵分解（MF）算法；最后基于自适应机制将评分数量映射到理想评分数量区间，并对算法偏置项施加不同的惩罚。在FilmTrust和CiaoDVD数据集上实验结果表明，与协同用户网络嵌入（CUNE）算法、一致性邻居聚合的推荐（ConsisRec）算法等算法相比，ASRNS的均方根误差（RMSE）分别至少降低了2.60%和5.53%，平均绝对误差（MAE）分别至少降低了1.47%和2.46%。可见，ASRNS不仅可以有效降低评分预测误差，还能显著改善算法训练过程中的过拟合问题，对不同评分数量的对象都具有较好的健壮性。

基于地理偏好排序的兴趣点混合推荐模型

彭诗杰, 陈红梅, 王丽珍, 肖清

2023, 43(8): 2448-2455. DOI: 10.11772/j.issn.1001-9081.2022071029

摘要 ( )

HTML ( )

PDF (1284KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着基于位置的社交网络（LBSN）迅速发展，作为缓解信息过载的有效手段，兴趣点（POI）推荐备受关注。由于用户签到数据是隐式反馈数据，且十分稀疏，为了有效地从用户签到数据中捕获用户POI偏好，提出了一个基于地理偏好排序的POI混合推荐模型。首先，考虑用户签到数据的隐式反馈特性及用户活动的空间约束，利用传统贝叶斯个性化排序（BPR）模型计算POI距离对POI排序的影响，提出加权BPR（GWBPR）模型；然后，针对用户签到数据的稀疏性，融合GWBPR模型和逻辑矩阵分解（LMF）模型，提出混合模型GWBPR-LMF。在两个真实数据集Foursquare和Gowalla上的实验结果表明，GWBPR-LMF模型的性能优于BPR、LMF、SAE-NAD（Self-Attentive Encoder and Neighbor-Aware Decoder）等对比模型。与较优的对比模型SAE-NAD相比，GWBPR-LMF模型的POI推荐的精确率、召回率、F1值、平均精度均值（mAP）、归一化折损累积增益（NDCG）在数据集Foursquare上分别平均提升了44.9%、57.1%、78.4%、55.3%和40.0%，在数据集Gowalla上分别平均提升了3.0%、6.4%、4.6%、11.7%和4.2%。

融合空间和文本信息的兴趣点类别表征模型

徐则林, 杨敏, 陈勐

2023, 43(8): 2456-2461. DOI: 10.11772/j.issn.1001-9081.2022071037

摘要 ( )

HTML ( )

PDF (2357KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

准确表征兴趣点（POI）类别（如大学、餐厅等）是理解城市空间、辅助城市计算的关键。现有的POI类别表征模型通常只挖掘用户在POI之间的移动行为并学习序列特征，而忽视了POI数据的空间特征和文本语义特征。为了解决上述问题，提出一种融合空间和文本信息的POI类别表征学习模型Cat2Vec。首先，利用POI的空间共现关系构建POI类别共现点互信息（PMI）矩阵；然后，基于预训练的文本表征模型学习POI的文本语义特征；最后，引入新的映射矩阵，并基于矩阵分解技术将PMI矩阵分解为POI类别表征矩阵、文本语义特征矩阵以及映射矩阵的内积。在两个真实世界的数据集Yelp和高德上进行的POI语义重叠度评测中，相较于基准模型中表现最好的Doc2Vec模型，所提模型的性能分别平均提高了5.53%和8.17%。实验结果表明所提模型能更有效地嵌入POI语义。

基于神经区分器的KATAN48算法条件差分分析方法

林东东, 李曼曼, 陈少真

2023, 43(8): 2462-2470. DOI: 10.11772/j.issn.1001-9081.2022060886

摘要 ( )

HTML ( )

PDF (2057KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对KATAN48算法的安全性分析问题，提出了一种基于神经区分器的KATAN48算法条件差分分析方法。首先，研究了多输出差分神经区分器的基本原理，并将它应用于KATAN48算法，根据KATAN48算法的数据格式调整了深度残差神经网络的输入格式和超参数；其次，建立了KATAN48算法的混合整数线性规划（MILP）模型，并用该模型搜索了前加差分路径及相应的约束条件；最后，利用多输出差分神经区分器，至多给出了80轮KATAN48算法的实际密钥恢复攻击结果。实验结果表明，在单密钥下，KATAN48算法的实际攻击的轮数提高了10轮，可恢复的密钥比特数增加了22比特，数据复杂度和时间复杂度分别由2³⁴和2³⁴降至2^16.39和2^19.68。可见，相较于前人单密钥下的实际攻击，所提方法能够有效增加攻击轮数和可恢复的密钥比特数，同时降低攻击的计算复杂度。

基于改进Inception-ResNet的加密流量分类方法

郭祥, 姜文刚, 王宇航

2023, 43(8): 2471-2476. DOI: 10.11772/j.issn.1001-9081.2022071030

摘要 ( )

HTML ( )

PDF (1743KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

基于深度学习的加密流量分类方法中的分类模型大多是深层直筒型结构，存在梯度消失的问题，且网络层数的增加会使模型结构和计算的复杂度显著上升。为此，提出了一种基于改进Inception-ResNet的加密流量分类方法。该方法通过改进Inception模块，并将该模块作为残差块以残差结构连接的方式嵌入卷积神经网络来构建分类模型；此外，改进分类模型的损失函数，并使用VPN-nonVPN数据集来验证所提方法的有效性。实验结果表明，所提方法在2种场景的分类实验中的精确率、召回率、F1值分别达到了94.21%、92.53%和93.31%以上。在与其他方法的对比实验中，以分类难度最大的12分类实验为例，所提方法比C4.5决策树算法和1D-CNN（1 Dimensional-Convolutional Neural Network）在精确率上分别高出13.91和9.50个百分点，在召回率上分别高出14.87和1.59个百分点。与CAE （Convolutional Auto Encoding）和SAE （Stacked Auto Encoder）等方法相比，所提方法虽然在各项指标上没有明显提升，但在单次训练时长上却有明显缩短，充分表明了所提方法的先进性。

软件定义网络中高效协同防御分布式拒绝服务攻击的方案

葛晨洋, 刘勤让, 裴雪, 魏帅, 朱正彬

2023, 43(8): 2477-2485. DOI: 10.11772/j.issn.1001-9081.2022060940

摘要 ( )

HTML ( )

PDF (3501KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对软件定义网络（SDN）中传统的分布式拒绝服务（DDoS）攻击的防御方案往往忽略了降低SDN工作负载的重要性，并且未考虑攻击缓解的及时性的问题，提出一种SDN中高效协同防御DDoS攻击的方案。首先，通过将部分防御任务卸载到数据平面中，降低控制平面的开销并充分利用数据平面的资源；然后，若检测到异常则产生快速数据路径（XDP）规则，以及时缓解攻击，同时将数据平面的统计信息交由控制平面来进一步检测和缓解攻击，从而在提升准确率的同时进一步降低控制器开销；最后，根据控制平面确定的异常源更新XDP规则。为验证所提方案的有效性，利用Hyenae攻击工具产生了3种不同类型的攻击数据。相较于依赖于控制平面的支持向量机（SVM）方案、新架构防御方案和跨平面协作的防御方案，在防御及时性方面，所提方案分别提高了33.33%、28.57%和21.05%；在中央处理器（CPU）消耗方面，所提方案分别降低了33、11和4个百分点。实验结果表明，所提方案能很好地防御DDoS攻击且有较低的性能开销。

基于新一代神威超算的量子计算模拟器加速和优化

史新民, 刘勇, 陈垚键, 宋佳伟, 刘鑫

2023, 43(8): 2486-2492. DOI: 10.11772/j.issn.1001-9081.2022091456

摘要 ( )

HTML ( )

PDF (2000KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对量子硬件规模逐步扩大、当下量子计算经典模拟速度不高的问题，提出了基于神威超算量子模拟器的两种优化方法。首先，通过改进张量转置策略和计算策略重新构建了张量收缩算子库SWTT，从而提高了部分张量收缩的计算内核效率并减少了冗余访存；其次，通过提高数据局部性的收缩路径调整方法实现了路径计算复杂度和计算效率之间的均衡。测试结果表明，该算子库改进方法可将“悬铃木”量子霸权电路模拟效率提升5.4%，单步张量收缩效率最高提升49.7倍；该路径调整方法可在路径计算复杂度膨胀2倍条件下提升约4倍的浮点效率。两种优化方法使神威超算整机模拟谷歌53量子比特20层量子芯片随机电路百万振幅采样的单精度和混合精度浮点运算效率分别从3.98%和1.69%提升至18.48%和7.42%，理论估计模拟时间从单精度的470 s降至226 s，混合精度的304 s降至134 s，证明两种方法大幅提高了量子计算模拟速度。

基于汉明距离的量子K-Means算法

钟静, 林晨, 盛志伟, 张仕斌

2023, 43(8): 2493-2498. DOI: 10.11772/j.issn.1001-9081.2022091469

摘要 ( )

HTML ( )

PDF (1623KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

K-Means算法在处理大规模异构数据时，通常使用欧氏距离来衡量数据点之间的相似度，然而这样存在效率低下以及计算复杂性过高的问题。受到汉明距离在处理数据相似性计算上存在显著优势的启发，提出一种基于汉明距离的量子K-Means（QKMH）算法来计算相似度。首先，将数据制备成量子态，并使用量子汉明距离计算待聚类点和K个聚类中心之间的相似度；然后，改进了Grover最小值搜索算法查找距离待聚类点最近的聚类中心；最后，循环以上步骤，直到达到规定迭代次数或者聚类中心不再改变。基于量子模拟计算框架QisKit，将提出的算法在MNIST手写数字数据集上进行了验证并与传统和改进的多种方法进行了对比，实验结果表明，QKMH算法的F1值相较于基于曼哈顿距离的量子K-Means算法提高了10个百分点，相较于最新优化的基于欧氏距离的量子K-Means算法提高了4.6个百分点；同时经计算，QKMH算法时间复杂度比上述对比算法更低。

零点分布更均匀的广义极谐复指数变换

曾泽芝, 杨建伟

2023, 43(8): 2499-2504. DOI: 10.11772/j.issn.1001-9081.2022071020

摘要 ( )

HTML ( )

PDF (5046KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对极谐复指数变换（PCET）因自身径向函数实部和虚部的零点分布不均匀而存在的信息抑制问题，提出了一种零点分布更均匀的广义PCET。首先，改造了PCET，将PCET径向函数的指数推广为更一般的构造函数，而近来出现的指数傅里叶矩（EFM）、分数阶极谐变换、广义极谐变换、修正的广义极谐变换等都是所提广义PCET的特例；其次，选取了构造函数，使得所构造的广义PCET的径向函数实部和虚部的零点分布更均匀，并给出了这一特性的证明。在所取的汉字图像库、Coil-20库和COREL库上进行了图像重构实验，同时测试了广义PCET的旋转不变性及抗噪性能。当噪声强度为0时，PCET和广义PCET的识别率均为100%，这验证了PCET和广义PCET的旋转不变性。相较于PCET，所提广义PCET具有更低的重构误差及更高的识别率。理论分析和实验结果表明，零点分布比PCET更均匀的广义PCET同样具有旋转不变性和正交性，且其重构性能和抗噪性能均优于PCET，一定程度上解决了PCET的信息抑制问题，并在原点处数值稳定。

基于零模型的含时网络模体识别方法

胡博仁, 裴忠民, 罗章凯, 丁杰

2023, 43(8): 2505-2510. DOI: 10.11772/j.issn.1001-9081.2022071033

摘要 ( )

HTML ( )

PDF (2277KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在带有时间属性的含时网络中，常规的基于频繁子图统计的网络模体识别方法容易受网络规模与结构差异的影响。而与实证网络具有相同规模和某些相同性质的零模型网络能为实证网络的特性挖掘提供了准确的基准，于是提出一种基于零模型的含时网络模体识别方法，用两种网络子图特征比较后的相对值来识别含时网络中的具有显著结构意义的子图。同时，为确定零模型网络何时达到稳定，采用成功置乱次数方法来改进基于时间置乱或时间随机化的含时网络零模型构造方法。在实验阶段，对包含卫星和地面站的46节点全球定位系统（GPS）星座进行仿真实验，确定了零模型网络子图特征稳定时的成功置乱次数；构造10个零模型网络与卫星网络比较，发现反映节点连接具有连续性特点的子图的出现次数仅为最高频子图的1/34，却是卫星网络中最重要的模体。实验结果表明，以零模型为参照的含时网络模体识别方法能更准确地识别出反映网络结构特性和动态变化过程的模体。

基于深度学习的多用户毫米波中继网络混合波束赋形

李校林, 杨松佳

2023, 43(8): 2511-2516. DOI: 10.11772/j.issn.1001-9081.2022081231

摘要 ( )

HTML ( )

PDF (1678KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统多用户毫米波中继系统波束赋形方案计算复杂度高的问题，提出一种基于深度学习（DL）的奇异值分解（SVD）方法来设计混合波束赋形，以优化发送端、中继端和接收端波束赋形器。首先，利用DL方法设计发送端、中继端的波束赋形矩阵最大化可实现的频谱效率；然后，设计中继端、接收端的频带波束赋形矩阵以最大化等效信道增益；最后，在接收端设计最小均方误差（MMSE）滤波器消除用户间干扰。理论分析和仿真结果表明，基于DL的混合波束赋形方法相较于交替最大化（AltMax）与传统SVD 方法在高维信道矩阵和较多的用户情况下，计算复杂度分别降低了12.5%和23.44%；在已知信道状态信息（CSI）的情况下，频谱效率分别提高了2.277%和21.335%，在非完美CSI情况下，频谱效率分别提高了11.452%和43.375%。

基于混合代码表示的源代码脆弱性检测

张琨, 杨丰玉, 钟发, 曾广东, 周世健

2023, 43(8): 2517-2526. DOI: 10.11772/j.issn.1001-9081.2022071135

摘要 ( )

HTML ( )

PDF (1958KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

软件脆弱性对网络与信息安全产生了极大的威胁，而脆弱性的根源在于软件源代码。因为现有的传统静态检测工具和基于深度学习的检测方法没有完整地表示代码特征，并且简单地使用词嵌入方法转换代码表示，所以检测结果准确率低，误报率高或漏报率高。因此，提出了一种基于混合代码表示的源代码脆弱性检测方法来解决代码表示不完整的问题，并提升检测性能。首先将源代码编译为中间表示（IR），并提取程序依赖图；然后基于数据流和控制流分析进行程序切片来得到结构化的特征，同时使用doc2vec嵌入节点语句得到非结构化的特征；接着使用图神经网络（GNN）对混合特征进行学习；最后使用训练好的GNN进行预测和分类。为了验证所提方法的有效性，在软件保证参考数据集（SARD）和真实世界数据集上进行了实验评估，检测结果的F1值分别达到了95.3%和89.6%。实验结果表明，所提方法有较好的脆弱性检测能力。

基于行为轮廓和逻辑Petri网的模型修复方法

张昊宇, 王丽丽

2023, 43(8): 2527-2536. DOI: 10.11772/j.issn.1001-9081.2022070980

摘要 ( )

HTML ( )

PDF (4583KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现实中的业务流程不断发生变化，需要对初始的业务流程模型进行修复以更好地表示实际业务流程。模型修复的关键步骤是分析现实日志和模型间的偏差，目前寻找偏差的方法主要采用对齐重演技术，未从行为的角度定量分析抽象的结构。因此，提出了一种通过行为轮廓分析日志和模型偏差的方法，并在此基础上进一步给出了基于逻辑Petri网的模型修复方法。首先，基于行为轮廓计算日志和模型间的服从度以识别偏差迹；然后，在偏差迹中依据偏差三元组集从偏差活动中选择逻辑变迁；最后，基于逻辑变迁设置逻辑函数，并通过添加新的分支或重构新的结构来修复原模型。对修复模型的适应度和精确度进行了验证，仿真实验结果表明，在尽可能保持修复模型与原始模型相似的基础上，相较于Fahland方法与Goldratt方法，所提修复方法在适应度都为1的情况下，得到的修复模型具有更高的精确度。

动态环境下视觉定位与建图的运动分割研究进展

朱东莹, 钟勇, 杨观赐, 李杨

2023, 43(8): 2537-2545. DOI: 10.11772/j.issn.1001-9081.2022070972

摘要 ( )

HTML ( )

PDF (2687KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

动态环境中视觉定位与建图系统受环境中动态物体的影响，定位与建图误差增加同时鲁棒性下降。而对输入图像的运动分割可显著提高动态环境下视觉定位与建图系统的性能。动态环境中的动态物体可分为运动物体与潜在运动物体。当前动态物体识别方法存在运动主体混乱、实时性差的问题。因此，综述了视觉定位与建图系统在动态环境下的运动分割策略。首先，从场景的预设条件出发，将运动分割策略分为基于图像主体静止假设方法、基于先验语义知识的方法和不引入假设的多传感融合方法；然后，对这三类方法进行总结，并分析各方法的准确性和实时性；最后，针对视觉定位与建图系统在动态环境下运动分割策略的准确性、实时性难以平衡的问题，讨论并展望了动态环境下运动分割方法的发展趋势。

基于深度学习的RGB图像目标位姿估计综述

王一, 谢杰, 程佳, 豆立伟

2023, 43(8): 2546-2555. DOI: 10.11772/j.issn.1001-9081.2022071022

摘要 ( )

HTML ( )

PDF (858KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

6自由度（DoF）位姿估计是计算机视觉与机器人技术中的一项关键技术，它能从给定的输入图像中估计物体的6DoF位姿，即3DoF平移和3DoF旋转，已经成为机器人操作、自动驾驶、增强现实等领域中的一项至关重要的任务。首先，介绍了6DoF位姿的概念以及基于特征点对应、基于模板匹配、基于三维特征描述符等传统方法存在的问题；然后，以基于特征对应、基于像素投票、基于回归和面向多物体实例、面向合成数据、面向类别级的不同角度详细介绍了当前主流的基于深度学习的6DoF位姿估计算法，归纳整理了在位姿估计方面常用的数据集以及评价指标，并对部分算法进行了实验性能评价；最后，给出了当前位姿估计面临的挑战和未来的重点研究方向。

基于中层细微特征提取与多尺度特征融合细粒度图像识别

齐爱玲, 王宣淋

2023, 43(8): 2556-2563. DOI: 10.11772/j.issn.1001-9081.2022071090

摘要 ( )

HTML ( )

PDF (2539KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在细粒度视觉识别领域，由于高度近似的类别之间差异细微，图像细微特征的精确提取对识别的准确率有着至关重要的影响。现有的相关热点研究算法中使用注意力机制提取类别特征已经成为一种趋势，然而这些算法忽略了不明显但可区分的细微部分特征，并且孤立了对象不同判别性区域之间的特征关系。针对这些问题，提出了基于中层细微特征提取与多尺度特征融合的图像细粒度识别算法。首先，利用通道与位置信息融合中层特征的权重方差度量提取图像显著特征，之后通过通道平均池化获得掩码矩阵抑制显著特征，并增强其他判别性区域细微特征的提取；然后，通过通道权重信息与像素互补信息获得通道与像素多尺度融合特征，以增强不同判别性区域特征的多样性与丰富性。实验结果表明，所提算法在数据集CUB-200-2011上达到89.52%的Top-1准确率、98.46%的Top-5准确率；在Stanford Cars数据集上达到94.64%的Top-1准确率、98.62%的Top-5准确率；在飞行器细粒度分类（FGVC-Aircraft）数据集上达到93.20%的Top-1准确率、97.98%的Top-5准确率。与循环协同注意力特征学习网络PCA-Net （Progressive Co-Attention Network）算法相比，所提算法的Top-1准确率分别提升了1.22、0.34和0.80个百分点，Top-5准确率分别提升了1.03、0.88和1.12个百分点。

融合视觉特征增强机制的机器人弱光环境抓取检测

李淦, 牛洺第, 陈路, 杨静, 闫涛, 陈斌

2023, 43(8): 2564-2571. DOI: 10.11772/j.issn.1001-9081.2023050586

摘要 ( )

HTML ( )

PDF (2821KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的机器人抓取操作通常在良好光照条件下开展，此时目标细节清晰、区域对比度高，而在夜间、遮挡等弱光环境下目标的视觉特征微弱，会导致现有的机器人抓取检测模型的检测准确率急剧下降。为提高弱光场景下稀疏、微弱抓取特征的表征能力，提出一种融合视觉特征增强机制的抓取检测模型，通过视觉增强子任务为抓取检测施加特征增强约束。对于抓取检测模块，采用仿U-Net框架的编码器-解码器结构实现特征的高效融合；对于弱光增强模块，从局部、全局层面分别提取纹理、颜色信息，以实现兼顾目标细节与视觉效果的特征增强。此外，分别构建弱光Cornell数据集和弱光Jacquard数据集两个新的弱光抓取基准数据集，并基于上述数据集开展对比实验。实验结果表明，所提弱光抓取检测模型在基准数据集上的准确率分别达到了95.5%和87.4%，与生成抓取卷积神经网络（GG-CNN）、生成残差卷积神经网络（GR-ConvNet）等现有抓取检测模型相比，准确率在弱光Cornell数据集提升11.1、1.2个百分点，在弱光Jacquard数据集上提升5.5、5.0个百分点，取得了较好的抓取检测效果。

基于ThetaMEX全局池化的人脸识别神经网络——ShuffaceNet

陈侃松, 郑园, 许立君, 王周宇, 张哲, 姚福娟

2023, 43(8): 2572-2580. DOI: 10.11772/j.issn.1001-9081.2022070985

摘要 ( )

HTML ( )

PDF (3354KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对目前大规模网络不适合在手机、平板电脑等资源匮乏的移动设备上使用，以及池化层会导致特征图的稀疏性最终影响神经网络识别精度的问题，提出了一个轻量级人脸识别神经网络ShuffaceNet，设计了一个非线性平滑Log-Mean-Exp函数ThetaMEX，并提出了一种端到端可训练的ThetaMEX全局池化层（TGPL），从而在保证算法精度的前提下，减少网络参数、提高运算速度，进而达到有效地将该网络部署在资源匮乏的移动设备上的目的。ShuffaceNet约有3 600个参数，模型大小仅为3.5 MB。在LFW（Labled Faces in the Wild）、AgeDB-30 （Age Database-30）、CFP （Celebrities in Frontal Profile）人脸数据集上的识别测试的结果表明，ShuffaceNet的精度分别达到了99.32%、93.17%、94.51%。与MobileNetV1、SqueezeNet、Xception相比，所提网络的大小分别缩减了73.1%、82.1%、78.5%，在AgeDB-30数据集上的精度分别提高了5.0%、6.3%、6.7%。可见，基于ThetaMEX全局池化的所提网络能够提高模型精度。

基于特征交互与自适应融合的骨骼动作识别

李豆豆, 李汪根, 夏义春, 束阳, 高坤

2023, 43(8): 2581-2587. DOI: 10.11772/j.issn.1001-9081.2022071105

摘要 ( )

HTML ( )

PDF (2179KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

当前骨骼动作识别任务中仍存在数据预处理不合理、模型参数量大、识别精度低的缺点。为解决以上问题，提出了一种基于特征交互与自适应融合的骨骼动作识别方法AFFGCN。首先，提出一种自适应分池数据预处理算法，以解决数据帧分布不均匀和数据帧代表性差的问题；其次，引入一种多信息特征交互的方法来挖掘更深的特征，以提高模型的性能；最后，提出一种自适应特征融合（AFF）模块用于图卷积特征融合，以进一步提高模型性能。实验结果表明，该方法在NTU-RGB+D 60数据集上较基线方法轻量级多信息图卷积神经网络（LMI-GCN）在交叉主题（CS）与交叉视角（CV）两种评估设置上均提升了1.2个百分点，在NTU-RGB+D 120数据集上较基线方法LMI-GCN在CS和交叉设置号（SS）评估设置上分别提升了1.5和1.4个百分点。而在单流和多流网络上的实验结果表明，相较于语义引导神经网络（SGN）等当前主流骨骼动作识别方法，所提方法的模型参数量更低、准确度更高，模型性能优势明显，更加适用于移动设备的部署。

基于GhostNet和特征融合的人脸活体检测算法

韩春港, 刘永辉

2023, 43(8): 2588-2592. DOI: 10.11772/j.issn.1001-9081.2022071100

摘要 ( )

HTML ( )

PDF (2929KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

人脸识别技术的广泛应用在为用户带来方便的同时，也带来了人脸欺骗和展示攻击等问题。针对经常出现的展示攻击和打印攻击问题，提出了一种基于GhostNet和特征融合的人脸活体检测算法。首先，将GhostNet模型的特征提取过程分为三种不同的阶段，即低等特征、中等特征和高等特征；然后，分别输出每个阶段的特征图信息；最后，将具有不同语义信息的特征图送入特征融合模块进行自适应加权融合，以获得更加具有辨别性的特征映射。在NUAA和CelebA-Spoof两个公开数据集上进行实验，实验结果表明所提算法的准确率分别为99.97%和93.41%，相较于GhostNet模型直接进行训练的算法分别提高了8.00和9.20个百分点。与异构内核的卷积神经网络（HK-CNN）、轻量级卷积神经网络FeatherNet、基于分块的多流网络FaceBagNet等算法相比，所提算法在NUAA和CelebA-Spoof数据集上表现出更好的性能；并且，由于GhostNet是一种轻量化的网络模型，所提算法在CelebA-Spoof数据集上对单张图像进行推理的时间仅需3.6 ms。

基于特征聚合的铜合金金相图分类识别方法

黄学雨, 贺怀宇, 林慧敏, 陈金水

2023, 43(8): 2593-2601. DOI: 10.11772/j.issn.1001-9081.2022060893

摘要 ( )

HTML ( )

PDF (5579KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对铜合金成分检测过程中产生的时滞问题，提出一种基于特征聚合的铜合金金相图分类识别方法。首先，在特征提取阶段，构建灰度共生矩阵（GLCM）和基于卷积注意力模块的残差网络（ResNet）模型分别提取图像的全局与局部特征；其次，在特征聚合阶段，将提取到的特征规范化后进行简单的级联；最后，在分类识别阶段，使用支持向量机（SVM）精确分类。实验结果表明，所提方法的准确率达到了98.963%、宏F1达到了98.996%，优于基于单特征的机器学习方法。可见，不同的方法提取的特征经过聚合后可以更全面地描述铜合金金相图的纹理及边缘信息，所提方法可以通过金相图识别不同铜合金，提升了识别的准确率，且具有良好的鲁棒性。

基于特征双融合CenterNet的白细胞检测方法

刘欢, 吴亮红, 张侣, 陈亮, 周博文, 张红强

2023, 43(8): 2602-2610. DOI: 10.11772/j.issn.1001-9081.2022071009

摘要 ( )

HTML ( )

PDF (4702KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对实际检测过程中复杂场景下由白细胞的形态、染色程度差异较大而导致白细胞检测困难的问题，提出一种基于特征双融合CenterNet的白细胞检测方法TFF-CenterNet（Twice-Fusion-Feature CenterNet）。首先，通过特征金字塔网络（FPN）将主干网络特征与反卷积层特征相融合，增强方法的特征提取能力，从而解决白细胞个体差异、染色程度不同等问题；然后，针对白细胞占据图像面积与图像背景面积严重不均衡的问题，改进热力图损失函数来提升对白细胞正样本的关注以提高检测平均精度均值（mAP）；最后，针对白细胞图像目标微小、位置随机、细胞粘连的特点，引入坐标注意力和坐标卷积，提高对白细胞位置信息的关注度和敏感性。对于复杂场景下的白细胞，TFF-CenterNet的mAP达到97.01%，比CenterNet高3.24个百分点；检测速度达到167 frame/s，比CenterNet快42 frame/s。实验结果表明，所提方法在复杂情况下能在提高白细胞检测mAP的同时达到实时性要求，并提升了鲁棒性，可为辅助医疗诊断中白细胞的快速自动检测提供技术支持。

基于改进YOLOv3的列车运行环境图像小目标检测算法

梁美佳, 刘昕武, 胡晓鹏

2023, 43(8): 2611-2618. DOI: 10.11772/j.issn.1001-9081.2022091343

摘要 ( )

HTML ( )

PDF (5709KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

列车辅助驾驶离不开对列车运行环境的实时检测，而列车运行环境图像存在丰富的小目标。与大中型目标相比，目标占原图比例小于1%的小目标由于分辨率低而存在误检率高、检测精度较差的问题，因此提出一种基于改进YOLOv3的列车运行环境目标检测算法YOLOv3-TOEI （YOLOv3-Train Operating Environment Image）。首先，利用k-means聚类算法优化anchor，从而提高网络的收敛速度；然后，在DarkNet-53中嵌入空洞卷积以增大感受野，并引入稠密卷积网络（DenseNet）获取更丰富的图像底层细节信息；最后，将原始YOLOv3的单向特征融合结构改进为双向自适应特征融合结构，从而实现深浅层特征的有效结合，并提高网络对多尺度目标（特别是小目标）的检测效果。实验结果表明，与原YOLOv3算法相比，YOLOv3-TOEI算法的平均精度均值（mAP）@0.5达到84.5%，提升了12.2%，每秒传输帧数（FPS）为83，拥有更好的列车运行环境图像小目标检测能力。

基于改进的YOLOv5的大坝表面病害检测算法

段升位, 程欣宇, 王浩舟, 王飞

2023, 43(8): 2619-2629. DOI: 10.11772/j.issn.1001-9081.2022081207

摘要 ( )

HTML ( )

PDF (7862KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对当前水利大坝主要依靠人工现场巡视，运营成本高且效率低的问题，提出一种基于YOLOv5的改进检测算法。首先，采用改进的多尺度的视觉Transformer结构改进主干网络，并利用多尺度Transformer结构关联的多尺度全局信息和卷积神经网络（CNN）提取的局部信息来构建聚合特征，从而充分利用多尺度的语义信息和位置信息来提高网络的特征提取能力。然后，在网络的每个特征检测层前加入同位注意力机制，以在图像的高度和宽度方向分别进行特征编码，再用编码后的特征构建特征图上像素的长距离关联，从而增强网络在复杂环境中的目标定位能力。接着，改进了网络正负训练样本的采样算法，通过构建先验框与真实框的平均契合度和差异度筛选样本来辅助候选正样本与自身形状相近的先验框产生响应，以帮助网络更快、更好地收敛，从而提升网络的整体性能和网络泛化性。最后，针对应用需求对网络进行了轻量化，并通过对网络结构剪枝和结构重参数化优化网络结构。实验结果表明：在当前采用的大坝病害数据上，对比原始YOLOv5s算法，改进后的网络mAP@0.5提升了10.5个百分点，mAP@0.5：0.95提高了17.3个百分点；轻量化后的网络对比轻量化之前的网络的参数量和计算量分别降低了24%和13%，检测速度提升了42%，满足当前应用场景下病害检测精度和速度的要求。

具有反馈控制的多自主体系统迭代学习输出一致性

王嘉欣, 刘成林

2023, 43(8): 2630-2635. DOI: 10.11772/j.issn.1001-9081.2022070976

摘要 ( )

HTML ( )

PDF (3046KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为改进多自主体系统的学习过程并提高系统对外部干扰的鲁棒性，提出一种具有反馈控制的迭代学习一致性控制算法。首先，自主体之间通过共享控制输入信息以改进其学习过程，并且当系统外部存在非迭代重复干扰时，通过设计反馈控制器以提高系统的鲁棒性；然后，使用压缩映射的方法对系统一致性进行分析，并严格推导出算法的收敛条件；最后，通过仿真实验验证了算法的正确性和有效性，改进后的算法与P型算法相比有更高的收敛速度，且在存在外部干扰时有更平滑的收敛曲线。

基于引导Minimax-DDQN的无人机空战机动决策

王昱, 任田君, 范子琳

2023, 43(8): 2636-2643. DOI: 10.11772/j.issn.1001-9081.2022071069

摘要 ( )

HTML ( )

PDF (5213KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对无人机(UAV)空战环境信息复杂、对抗性强所导致的敌机机动策略难以预测，以及作战胜率不高的问题，设计了一种引导Minimax-DDQN（Minimax-Double Deep Q-Network）算法。首先，在Minimax决策方法的基础上提出了一种引导式策略探索机制；然后，结合引导Minimax策略，以提升Q网络更新效率为出发点设计了一种DDQN（Double Deep Q-Network）算法；最后，提出进阶式三阶段的网络训练方法，通过不同决策模型间的对抗训练，获取更为优化的决策模型。实验结果表明，相较于Minimax-DQN（Minimax-DQN）、Minimax-DDQN等算法，所提算法追击直线目标的成功率提升了14%~60%，并且与DDQN算法的对抗胜率不低于60%。可见，与DDQN、Minimax-DDQN等算法相比，所提算法在高对抗的作战环境中具有更强的决策能力，适应性更好。

基于改进人工势场和一致性协议的协同避障算法

张钟元, 戴炜, 李光昱, 陈小庆, 邓启波

2023, 43(8): 2644-2650. DOI: 10.11772/j.issn.1001-9081.2022070967

摘要 ( )

HTML ( )

PDF (3281KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

协同避障是无人机（UAV）系统的关键技术之一，而UAV集群避障期间存在队形丢失、任务失效和能源消耗增加等问题。为解决这些问题，提出了一种基于改进人工势场和一致性协议的协同避障算法。首先，根据多旋翼UAV的控制律来设计保持速度、位置一致的控制协议，并采用归一化和高阶指数缩放变换人工势场力，从而解决势场力变化幅度过大导致的振荡失效问题；然后，引入人工势场力调整一致性协议期望编队，从而解决人工势场法与一致性协议组合算法的控制冲突问题。在复杂障碍环境下，所提算法与编队划分避障算法、动态窗口避障算法进行对比仿真的结果表明，所提算法的队形平均损失程度分别下降82.60%、64.38%，任务平均失效程度分别下降98.66%、86.01%，飞行路径总长度分别下降9.95%、17.63%。可见，所提算法适用于多障碍复杂飞行环境。

当期目录