当期目录

    2022年 第42卷 第5期 刊出日期:2022-05-10
    人工智能
    融合字注释的文本分类模型
    杨先凤, 赵家和, 李自强
    2022, 42(5):  1317-1323.  DOI: 10.11772/j.issn.1001-9081.2021030489
    摘要 ( )   HTML ( )   PDF (1662KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统文本特征表示方法无法充分解决一词多义的问题,构建了一种融合字注释的文本分类模型。首先,借助现有中文字典,获取文本由字上下文选取的字典注释,并对其进行Transformer的双向编码器(BERT)编码来生成注释句向量;然后,将注释句向量与字嵌入向量融合作为输入层,并用来丰富输入文本的特征信息;最后,通过双向门控循环单元(BiGRU)学习文本的特征信息,并引入注意力机制突出关键特征向量。在公开数据集THUCNews和新浪微博情感分类数据集上进行的文本分类的实验结果表明,融合BERT字注释的文本分类模型相较未引入字注释的文本分类模型在性能上有显著提高,且在所有文本分类的实验模型中,所提出的BERT字注释_BiGRU_Attention模型有最高的精确率和召回率,能反映整体性能的F1-Score则分别高达98.16%和96.52%。

    融合语料库特征与图注意力网络的短文本分类方法
    杨世刚, 刘勇国
    2022, 42(5):  1324-1329.  DOI: 10.11772/j.issn.1001-9081.2021030508
    摘要 ( )   HTML ( )   PDF (1121KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    短文本分类是自然语言处理(NLP)中的重要研究问题,广泛应用于新闻分类、情感分析、评论分析等领域。针对短文本分类中存在的数据稀疏性问题,通过引入语料库的节点和边权值特征,基于图注意力网络(GAT),提出了一个融合节点和边权值特征的图注意力网络NE-GAT。首先,针对每个语料库构建异构图,利用引力模型(GM)评估单词节点的重要性,并通过节点间的点互信息(PMI)获得边权重;其次,为每个句子构建文本级别图,并将节点重要性和边权重融入节点更新过程。实验结果表明,所提模型在测试集上的平均准确率达到了75.48%,优于用于文本分类的图卷积网络(Text-GCN)、TL-GNN、Text-ING等模型;相较原始GAT,所提模型的平均准确率提升了2.32个百分点,验证了其有效性。

    基于情感分析和影响力评估的突发事件情感图谱
    仇丽青, 曲福帅
    2022, 42(5):  1330-1338.  DOI: 10.11772/j.issn.1001-9081.2021040654
    摘要 ( )   HTML ( )   PDF (3347KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对突发事件中负面网络舆情传播的问题,提出了一种基于情感分析和影响力评估的突发事件情感图谱研究方法。提出了一种基于多头自注意力机制和双向长短期记忆网络(Bi-LSTM)的情感分析模型来计算网站用户的情感倾向,并提出了一种融合加权度与K-shell值的节点影响力评估算法来评估用户的影响力,从而综合构建突发事件的情感图谱,有效提高了情感图谱的准确性和科学性。以“7.7安顺公交车坠湖事件”为例,将突发事件的生命周期划分为爆发期、蔓延期、成熟期和衰退期四个阶段,分别生成情感图谱进行可视化分析。实验结果表明,在酒店评论数据集上,所提出的情感分析模型的F1值在积极和消极方面比文本循环神经网络(Text-RNN)模型分别提升了9.92个百分点和2.5个百分点;在Karate网络上,所提影响力评估算法的区分度和准确性比K-shell算法分别提升了46.89个百分点和29.05个百分点。构建基于社交网络的情感图谱有助于相关部门发现意见领袖及其情感倾向,从而把握网络舆情的发展趋势,并降低消极情感对社会造成的影响。

    融合知识图谱和差分隐私的新闻推荐方法
    王利娥, 李小聪, 刘红翼
    2022, 42(5):  1339-1346.  DOI: 10.11772/j.issn.1001-9081.2021030527
    摘要 ( )   HTML ( )   PDF (1421KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有融合知识图谱和隐私保护的推荐方法不能有效平衡差分隐私(DP)噪声与推荐系统性能的问题,提出了一种融合知识图谱和隐私保护的新闻推荐方法(KGPNRec)。首先,采用多通道知识感知的卷积神经网络(KCNN)模型融合新闻标题、知识图谱中实体和实体上下文等多维度的特征向量,以提高推荐的准确度;其次,利用注意力机制为不同敏感程度的特征向量添加不同程度的噪声,从而降低噪声对数据分析的影响;然后,对加权的用户特征向量添加统一的拉普拉斯噪声,以保证用户数据的安全性;最后,在真实的新闻数据集上进行实验分析。实验结果表明,与隐私保护的多任务推荐方法(PPMTF)和基于深度知识感知网络(DKN)的推荐方法等相比,所提KGPNRec在保护用户隐私的同时能保证方法的预测性能。在Bing News数据集上,所提方法的曲线下面积(AUC)值、准确率和F1分数与PPMTF相比分别提高了0.019、0.034和0.034。

    融合成对编码方案及二维卷积神经网络的长短期会话推荐算法
    陈学勤, 陶涛, 张钟旺, 王一蕾
    2022, 42(5):  1347-1354.  DOI: 10.11772/j.issn.1001-9081.2021030467
    摘要 ( )   HTML ( )   PDF (1011KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    虽然基于循环神经网络(RNN)的会话推荐算法可以有效地对会话中的长期依赖关系进行建模,并且可以结合注意力机制来刻画用户在会话中的主要目的,但它在进行会话建模的过程中无法绕过与用户主要目的不相关的物品,易受其影响以致降低推荐精度。针对上述问题,设计了成对编码方案来将原始输入序列嵌入向量转化为一个三维张量表示,使得非相邻的行为也能够产生联系。通过二维卷积神经网络(CNN)来处理该张量以捕获非相邻物品间的联系,并提出了引入用于会话推荐的二维卷积神经网络的神经注意力推荐机(COS-NARM)模型。该模型能有效跳过序列中与用户主要目的不相关的物品。实验结果表明,COS-NARM模型在DIGINETICA等多个真实数据集上的召回率和平均倒数排名(MRR)都得到了不同程度的提升,且优于NARM、GRU-4Rec+等所有基线模型。在上述研究的基础上,将欧氏距离引入COS-NARM模型,提出了OCOS-NARM模型。利用欧氏距离直接计算不同时刻兴趣间的相似度以减少模型的参数,降低模型的复杂度。实验结果表明,欧氏距离的引入不仅使得OCOS-NARM模型在DIGINETICA等多个真实数据集上的推荐效果得到了进一步的提升,而且使OCOS-NARM模型的训练时间相较COS-NARM模型缩短了14.84%,有效提高了模型的训练速度。

    基于邻域粗糙集和帝王蝶优化的特征选择算法
    孙林, 赵婧, 徐久成, 王欣雅
    2022, 42(5):  1355-1366.  DOI: 10.11772/j.issn.1001-9081.2021030497
    摘要 ( )   HTML ( )   PDF (1375KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对经典的帝王蝶优化(MBO)算法不能很好地处理连续型数据,以及粗糙集模型对于大规模、高维复杂的数据处理能力不足等问题,提出了基于邻域粗糙集(NRS)和MBO的特征选择算法。首先,将局部扰动和群体划分策略与MBO算法结合,并构建传输机制以形成一种二进制MBO(BMBO)算法;其次,引入突变算子增强算法的探索能力,设计了基于突变算子的BMBO(BMBOM)算法;然后,基于NRS的邻域度构造适应度函数,并对初始化的特征子集的适应度值进行评估并排序;最后,使用BMBOM算法通过不断迭代搜索出最优特征子集,并设计了一种元启发式特征选择算法。在基准函数上评估BMBOM算法的优化性能,并在UCI数据集上评价所提出的特征选择算法的分类能力。实验结果表明,在5个基准函数上,BMBOM算法的最优值、最差值、平均值以及标准差明显优于MBO和粒子群优化(PSO)算法;在UCI数据集上,与基于粗糙集的优化特征选择算法、结合粗糙集与优化算法的特征选择算法、结合NRS与优化算法的特征选择算法、基于二进制灰狼优化的特征选择算法相比,所提特征选择算法在分类精度、所选特征数和适应度值这3个指标上表现良好,能够选择特征数少且分类精度高的最优特征子集。

    融合学习心理学的人类学习优化算法
    孟晗, 马良, 刘勇
    2022, 42(5):  1367-1374.  DOI: 10.11772/j.issn.1001-9081.2021030505
    摘要 ( )   HTML ( )   PDF (1244KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对简单人类学习优化(SHLO)算法寻优精度低和收敛慢的问题,提出了一种融合学习心理学的人类学习优化算法(LPHLO)。首先,结合学习心理学中的小组学习(TBL)理论引入TBL算子,从而在个体经验、社会经验的基础上,增加了小组经验来对个体学习状态进行控制,避免算法早熟收敛;然后,结合记忆编码理论提出了动态调参策略,从而实现个体信息、社会信息、团队信息的有效融合,更好地平衡了算法局部探索和全局开发的能力。选取典型的组合优化难题——背包问题中的两种算例,即单约束背包问题、多约束背包问题进行仿真实验,实验结果表明,所提LPHLO与基本的SHLO算法、遗传算法(GA)和二进制粒子群优化(BPSO)算法等算法相比,在寻优精度和收敛速度方面更具优势,具有更好的解决实际问题的能力。

    基于非负矩阵分解与稀疏表示的多标签分类算法
    包永春, 张建臣, 杜守信, 张军军
    2022, 42(5):  1375-1382.  DOI: 10.11772/j.issn.1001-9081.2021050706
    摘要 ( )   HTML ( )   PDF (773KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传统的多标签分类算法是以二值标签预测为基础的,而二值标签由于仅能指示数据是否具有相关类别,所含语义信息较少,无法充分表示标签语义信息。为充分挖掘标签空间的语义信息,提出了一种基于非负矩阵分解和稀疏表示的多标签分类算法(MLNS)。该算法结合非负矩阵分解与稀疏表示技术,将数据的二值标签转化为实值标签,从而丰富标签语义信息并提升分类效果。首先,对标签空间进行非负矩阵分解以获得标签潜在语义空间,并将标签潜在语义空间与原始特征空间结合以形成新的特征空间;然后,对此特征空间进行稀疏编码来获得样本间的全局相似关系;最后,利用该相似关系重构二值标签向量,从而实现二值标签与实值标签的转化。在5个标准多标签数据集和5个评价指标上将所提算法与MLBGM、ML2、LIFT和MLRWKNN等算法进行对比。实验结果表明,所提MLNS在多标签分类中优于对比的多标签分类算法,在50%的案例中排名第一,在76%的案例中排名前二,在全部的案例中排名前三。

    基于全局与局部标签关系的多标签图像分类方法
    任炜, 白鹤翔
    2022, 42(5):  1383-1390.  DOI: 10.11772/j.issn.1001-9081.2021071240
    摘要 ( )   HTML ( )   PDF (4088KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对多标签图像分类任务中存在的难以对标签间的相互作用建模和全局标签关系固化的问题,结合自注意力机制和知识蒸馏(KD)方法,提出了一种基于全局与局部标签关系的多标签图像分类方法(ML-GLLR)。首先,局部标签关系(LLR)模型使用卷积神经网络(CNN)、语义模块和双层自注意力(DLSA)模块对局部标签关系建模;然后,利用KD方法使LLR学习全局标签关系。在公开数据集MSCOCO2014和VOC2007上进行实验,LLR相较于基于图卷积神经网络多标签图像分类(ML-GCN)方法,在平均精度均值(mAP)上分别提高了0.8个百分点和0.6个百分点,ML-GLLR相较于LLR在mAP上分别进一步提高了0.2个百分点和1.3个百分点。实验结果表明,所提ML-GLLR不仅能对标签间的相互关系进行建模,也能避免全局标签关系固化的问题。

    基于注意力机制学习域内变化的跨域行人重识别方法
    陈代丽, 许国良
    2022, 42(5):  1391-1397.  DOI: 10.11772/j.issn.1001-9081.2021030459
    摘要 ( )   HTML ( )   PDF (2210KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对行人重识别任务跨域迁移时性能严重衰退的问题,提出了一种基于注意力机制学习域内变化的跨域行人重识别方法。首先,以ResNet50为基础架构并对其进行调整使其适合行人重识别任务,并引入实例-批归一化网络(IBN-Net)以提高模型的泛化能力,同时增加区域注意力分支以提取更具鉴别性的行人特征。对于源域的训练,将其作为分类任务,使用交叉熵损失进行源域的有监督学习,同时引入三元组损失来挖掘源域样本的细节,从而提高源域的分类性能。对于目标域的训练,通过学习域内变化来适应源域和目标域间的数据分布差异。在测试阶段,以ResNet50 pool-5层的输出作为图像特征,并计算查询图像与候选图像间的欧氏距离来度量两者的相似度。在两个大规模公共数据集Market-1501和DukeMTMC-reID上进行实验,所提方法的Rank-1准确率分别达到80.1%和67.7%,平均精度均值(mAP)分别为49.5%和44.2%。实验结果表明,所提方法在提高模型泛化能力方面性能较优。

    基于非局部高分辨率网络的轻量化人体姿态估计方法
    孙琪翔, 何宁, 张敬尊, 宏晨
    2022, 42(5):  1398-1406.  DOI: 10.11772/j.issn.1001-9081.2021030512
    摘要 ( )   HTML ( )   PDF (3303KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    人体姿态估计是计算机视觉中的基本任务之一,可应用于动作识别、游戏、动画制作等领域。当前深度网络模型的设计大多通过加深网络以获得更好的性能,结果导致计算资源的需求超出嵌入式设备和移动设备的计算能力,达不到实际应用要求。针对上述问题,提出了一种融合Ghost模块结构的轻量级网络模型,即使用Ghost模块替换原高分辨率网络中的基础模块,从而减少网络模型的参数量。此外,设计了非局部高分辨率网络,即在网络1/32分辨率阶段融合非局部网络模块,使网络具有获取全局特征的能力,从而提高人体姿态估计的准确率,并在保证模型准确率的前提下降低网络参数量。在MPII人体姿态估计数据集和COCO人体姿态估计数据集上的实验结果表明,所提网络模型与原高分辨率网络相比,在网络模型参数量降低40%的情况下,人体姿态估计准确率提升了1.8个百分点。

    面向三维点云单目标跟踪的提案聚合网络
    庄屹, 赵海涛
    2022, 42(5):  1407-1416.  DOI: 10.11772/j.issn.1001-9081.2021030533
    摘要 ( )   HTML ( )   PDF (3836KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    与二维可见光图像相比,三维点云在空间中保留了物体真实丰富的几何信息,能够应对单目标跟踪问题中存在尺度变换的视觉挑战。针对三维目标跟踪精度受到点云数据稀疏性导致的信息缺失影响,以及物体位置变化带来的形变影响这两个问题,在端到端的学习模式下提出了由三个模块构成的提案聚合网络,通过在最佳提案内定位物体的中心来确定三维边界框从而实现三维点云中的单目标跟踪。首先,将模板和搜索区域的点云数据转换为鸟瞰伪图,模块一通过空间和跨通道注意力机制丰富特征信息;然后,模块二用基于锚框的深度互相关孪生区域提案子网给出最佳提案;最后,模块三先利用最佳提案对搜索区域的感兴趣区域池化操作来提取目标特征,随后聚合了目标与模板特征,利用稀疏调制可变形卷积层来解决点云稀疏以及形变的问题并确定了最终三维边界框。在KITTI跟踪数据集上把所提方法与最新的三维点云单目标跟踪方法进行比较的实验结果表明:在汽车类综合性实验中,真实场景中所提方法在成功率上提高了1.7个百分点,精确率上提高了0.2个百分点;在多类别扩展性实验上,即在汽车、货车、骑车人以及行人这4类上所提方法的平均成功率提高了0.8个百分点,平均精确率提高了2.8个百分点。可见,所提方法能够解决三维点云中的单目标跟踪问题,使得三维目标跟踪结果更加精确。

    工业场景下基于秩信息对YOLOv4的剪枝
    秦晓, 成苗, 张绍兵, 何莲, 石向文, 王品学, 曾尚
    2022, 42(5):  1417-1423.  DOI: 10.11772/j.issn.1001-9081.2021030448
    摘要 ( )   HTML ( )   PDF (2320KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在工业场景无线射频识别(RFID)实时缺陷检测任务中,为了保证检测精度以及速度常采用YOLO这类深度学习目标检测算法,然而这些算法仍然难以满足工业检测中的速度要求,且无法将相应的网络模型部署到资源受限的设备上。针对以上问题,需要对YOLO模型进行剪枝压缩,提出了一种基于秩信息的特征信息丰富性和特征信息多样性加权融合的新型网络剪枝方法。首先,加载未剪枝模型进行推理,并在前向传播中获取滤波器对应特征图的秩信息来衡量特征信息丰富性;然后,根据不同大小的剪枝率对秩信息进行聚类或者相似度计算来衡量特征信息的多样性;最后,加权融合得到对应滤波器的重要性程度并对其进行排序后,剪除重要性排序靠后的滤波器。实验结果表明,对于YOLOv4,在剪枝率为28.87%且特征信息丰富性权重为0.75的情况下,所提方法相较于单一使用特征图秩信息的方法提高了2.6%~8.9%的平均精度均值(mAP),所提方法剪枝后的模型甚至相较于未剪枝模型提高了0.4%的mAP并减少了35.0%的模型参数,表明该方法有利于模型部署。

    基于神经网络架构搜索的肺结节分类算法
    谢新林, 肖毅, 续欣莹
    2022, 42(5):  1424-1430.  DOI: 10.11772/j.issn.1001-9081.2021050813
    摘要 ( )   HTML ( )   PDF (1632KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    肺结节分类是早期肺癌诊断的重要任务。基于深度学习的肺结节分类方法虽然能够取得良好的分类精度,但存在模型复杂和可解释性差的问题。为此,提出了一种基于神经网络架构搜索的肺结节分类算法。首先,将注意力残差卷积cell作为搜索空间的基本单元,并使用偏序剪枝方法作为搜索策略来构建神经网络架构以搜索3D分类网络,从而达到网络性能和搜索速度的平衡。其次,在网络中构建了多尺度通道和空间注意力模块来提高特征描述和类别推理的可解释性。最后,采用堆叠法将搜索到的网络架构进行多模型的融合,从而获取精准的肺结节良恶性分类预测结果。实验结果表明,在肺结节分类常用数据集LIDC-IDRI上,所提算法与最新肺结节分类算法相比具有较好的分类性能和较快的收敛,且所提算法的特异性和精确率分别达到95.37%和93.42%,能够实现良恶性肺结节的准确分类。

    基于有效通道注意力的遥感图像场景分类
    屈震, 李堃婷, 冯志玺
    2022, 42(5):  1431-1439.  DOI: 10.11772/j.issn.1001-9081.2021030464
    摘要 ( )   HTML ( )   PDF (2678KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对基于人工设计特征的方法不能提取高层次遥感图像信息以及以往利用VGGNet、ResNet等卷积神经网络(CNN)无法关注到遥感图像中显著分类特征的问题,提出了一种基于有效通道注意力(ECA)机制的遥感图像场景分类新模型——ECA-ResNeXt-8-SVM。为了建立高效模型,一方面,设计了嵌入ECA模块的深度特征提取网络ECA-ResNeXt-8,通过端到端的学习使网络更关注分类特征明显的通道;另一方面,利用支持向量机(SVM)代替全连接层作为已提取到的深度特征的分类器,从而进一步提高模型的分类准确率与泛化能力。该模型在实验数据集UC Merced Land-Use上的分类准确率达到95.81%,相较于使用SE-ResNeXt50与ResNeXt50网络,分别提高了6%与18%,且在分类准确率为75%时所提模型的训练时间比上述两个网络分别减少了82%与81%。实验结果表明,所提模型能够有效地减少模型的收敛时间并提升遥感图像场景分类的准确率。

    基于深度特征融合的无纺布低对比度浆丝缺陷检测方法
    鲁永帅, 唐英杰, 马鑫然
    2022, 42(5):  1440-1446.  DOI: 10.11772/j.issn.1001-9081.2021050834
    摘要 ( )   HTML ( )   PDF (2419KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对无纺布生产过程中产生的浆丝缺陷对比度较低,以及传统图像处理方法对其检测效果较差的问题,提出了一种基于卷积神经网络(CNN)的无纺布低对比度浆丝缺陷检测方法。首先,对采集到的无纺布图像进行预处理以构建浆丝缺陷数据集;然后,利用改进的卷积神经网络以及多尺度特征采样融合模块构造编码器以提取低对比度浆丝缺陷的语义信息,并在解码器中采用跳跃连接进行多尺度特征融合来优化上采样模块;最后,通过所构建的数据集训练网络模型,从而实现低对比度浆丝缺陷的检测。实验结果表明,所提方法可以有效定位并检测出无纺布上的低对比度浆丝缺陷,其平均交并比(MIoU)、类别平均像素准确率(MPA)分别可以达到77.32%和86.17%,单张样本平均检测时间为50 ms,能够满足工业生产的要求。

    数据科学与技术
    基于交叉层级数据共享的多任务模型
    陈颖, 于炯, 陈嘉颖, 杜旭升
    2022, 42(5):  1447-1454.  DOI: 10.11772/j.issn.1001-9081.2021030516
    摘要 ( )   HTML ( )   PDF (1841KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对多任务学习模型中相关度低的任务之间存在的负迁移现象和信息共享困难问题,提出了一种基于交叉层级数据共享的多任务模型。该模型关注细粒度的知识共享,且能保留浅层共享专家的记忆能力和深层特定任务专家的泛化能力。首先,统一多层级共享专家,以获取复杂相关任务间的公共知识;然后,将共享信息分别迁移到不同层级的特定任务专家之中,从而在上下层之间共享部分公共知识;最后,利用基于数据样本的门控网络自主选择不同任务所需信息,从而减轻样本依赖性对模型的不利影响。相较于多门控混合专家(MMOE)模型,所提模型在UCI census-income数据集上对两个任务的F1值分别提高了7.87个百分点和1.19个百分点;且在MovieLens数据集上的回归任务的均方误差(MSE)值降低到0.004 7,分类任务的AUC值提高到0.642。实验结果表明,所提出的模型适用于改善负迁移现象的影响,且能更高效地学习复杂相关任务之间的公共信息。

    密度峰值优化的球簇划分欠采样不平衡数据分类算法
    刘学文, 王继奎, 杨正国, 李强, 易纪海, 李冰, 聂飞平
    2022, 42(5):  1455-1463.  DOI: 10.11772/j.issn.1001-9081.2021050736
    摘要 ( )   HTML ( )   PDF (1551KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在集成算法中嵌入代价敏感和重采样方法是一种有效的不平衡数据分类混合策略。针对现有混合方法中误分代价计算和欠采样过程较少考虑样本的类内与类间分布的问题,提出了一种密度峰值优化的球簇划分欠采样不平衡数据分类算法DPBCPUSBoost。首先,利用密度峰值信息定义多数类样本的抽样权重,将存在“近邻簇”的多数类球簇划分为“易误分区域”和“难误分区域”,并提高“易误分区域”内样本的抽样权重;其次,在初次迭代过程中按照抽样权重对多数类样本进行欠采样,之后每轮迭代中按样本分布权重对多数类样本进行欠采样,并把欠采样后的多数类样本与少数类样本组成临时训练集并训练弱分类器;最后,结合样本的密度峰值信息与类别分布为所有样本定义不同的误分代价,并通过代价调整函数增加高误分代价样本的权重。在10个KEEL数据集上的实验结果表明,与现有自适应增强(AdaBoost)、代价敏感自适应增强(AdaCost)、随机欠采样增强(RUSBoost)和代价敏感欠采样自适应增强(USCBoost)等不平衡数据分类算法相比,DPBCPUSBoost在准确率(Accuracy)、F1分数(F1-Score)、几何均值(G-mean)和受试者工作特征(ROC)曲线下的面积(AUC)指标上获得最高性能的数据集数量均多于对比算法。实验结果验证了DPBCPUSBoost中样本误分代价和抽样权重定义的有效性。

    基于自适应近邻参数的密度峰聚类算法
    周欢欢, 郑伯川, 张征, 张琦
    2022, 42(5):  1464-1471.  DOI: 10.11772/j.issn.1001-9081.2021050753
    摘要 ( )   HTML ( )   PDF (5873KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对基于共享最近邻的密度峰聚类算法中的近邻参数需要人为设定的问题,提出了一种基于自适应近邻参数的密度峰聚类算法。首先,利用所提出的近邻参数搜索算法自动获得近邻参数;然后,通过决策图选取聚类中心;最后,根据所提出的代表点分配策略,先分配代表点,后分配非代表点,从而实现所有样本点的聚类。将所提出的算法与基于共享最近邻的快速密度峰搜索聚类(SNN?DPC)、基于密度峰值的聚类(DPC)、近邻传播聚类(AP)、对点排序来确定聚类结构(OPTICS)、基于密度的噪声应用空间聚类(DBSCAN)和K-means这6种算法在合成数据集以及UCI数据集上进行聚类结果对比。实验结果表明,所提出的算法在调整互信息(AMI)、调整兰德系数(ARI)和FM指数(FMI)等评价指标上整体优于其他6种算法。所提算法能自动获得有效的近邻参数,且能较好地分配簇边缘区域的样本点。

    基于局部引力和距离的聚类算法
    杜洁, 马燕, 黄慧
    2022, 42(5):  1472-1479.  DOI: 10.11772/j.issn.1001-9081.2021030515
    摘要 ( )   HTML ( )   PDF (3200KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    密度峰值聚类(DPC)算法对于密度多样、形状复杂的数据集不能准确选择聚类中心,同时基于局部引力的聚类(LGC)算法参数较多且需要手动调参。针对这些问题,提出了一种基于局部引力和距离的聚类算法(LGDC)。首先,利用局部引力模型计算数据点的集中度(CE),根据集中度确定每个数据点与高集中度的点之间的距离;然后,选取具有高集中度值和高距离值的数据点作为聚类中心;最后,基于簇的内部点集中度远高于边界点的集中度的思想,分配其余数据点,并且利用平衡k近邻实现参数的自动调整。实验结果表明,LGDC在4个合成数据集上取得了更好的聚类效果;且在Wine、SCADI、Soybean等真实数据集上,LGDC的调整兰德系数(ARI)指标相较DPC、LGC等算法平均提高了0.144 7。

    网络空间安全
    基于图像秘密共享的密文域可逆信息隐藏算法
    王泽曦, 张敏情, 柯彦, 孔咏骏
    2022, 42(5):  1480-1489.  DOI: 10.11772/j.issn.1001-9081.2021050823
    摘要 ( )   HTML ( )   PDF (4022KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对当前密文域可逆信息隐藏算法嵌入秘密信息后的携密密文图像的容错性与抗灾性不强,一旦遭受攻击或损坏就无法重构原始图像与提取秘密信息的问题,提出了一种基于图像秘密共享的密文域可逆信息隐藏算法,并分析了该算法在云环境下的应用场景。首先,将加密图像分割成大小相同的n份不同携密密文图像。然后,在分割的过程中将拉格朗日插值多项式中的随机量作为冗余信息,并建立秘密信息与多项式各项系数间的映射关系。最后,通过修改加密过程的内置参数,实现秘密信息的可逆嵌入。当收集k份携密密文图像时,可无损地恢复原始图像与提取秘密信息。实验结果表明,所提算法具有计算复杂度低、嵌入容量大和完全可逆等特点。在(3,4)门限方案中,所提算法的最大嵌入率可达4 bpp;在(4,4)门限方案中,其最大嵌入率可达6 bpp。所提算法充分发挥了秘密共享方案的容灾特性,在不降低秘密共享安全性的基础上,增强了携密密文图像的容错性与抗灾性,提高了算法的嵌入容量与云环境应用场景下的容灾能力,保证了载体图像与秘密信息的安全。

    基于代码图像合成的Android恶意软件家族分类方法
    李默, 芦天亮, 谢子恒
    2022, 42(5):  1490-1499.  DOI: 10.11772/j.issn.1001-9081.2021030486
    摘要 ( )   HTML ( )   PDF (3025KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    代码图像化技术被提出后在Android恶意软件研究领域迅速普及。针对使用单个DEX文件转换而成的代码图像表征能力不足的问题,提出了一种基于代码图像合成的Android恶意软件家族分类方法。首先,将安装包中的DEX、XML与反编译生成的JAR文件进行灰度图像化处理,并使用Bilinear插值算法来放缩处理不同尺寸的灰度图像,然后将三张灰度图合成为一张三维RGB图像用于训练与分类。在分类模型上,将软阈值去噪模块与基于Split-Attention的ResNeSt相结合提出了STResNeSt。该模型具备较强的抗噪能力,更能关注代码图像的重要特征。针对训练过程中的数据长尾分布问题,在数据增强的基础上引入了类别平衡损失函数(CB Loss),从而为样本不平衡造成的过拟合现象提供了解决方案。在Drebin数据集上,合成代码图像的准确率领先DEX灰度图像2.93个百分点,STResNeSt与残差神经网络(ResNet)相比准确率提升了1.1个百分点,且数据增强结合CB Loss的方案将F1值最高提升了2.4个百分点。实验结果表明,所提方法的平均分类准确率达到了98.97%,能有效分类Android恶意软件家族。

    基于实用拜占庭容错的改进的多主节点共识机制
    任秀丽, 张雷
    2022, 42(5):  1500-1507.  DOI: 10.11772/j.issn.1001-9081.2021050772
    摘要 ( )   HTML ( )   PDF (1899KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对实用拜占庭容错(PBFT)共识协议通信复杂度高导致的共识效率低、单一主节点发生故障或存在拜占庭行为时会导致共识过程停止的问题,提出了改进的多主节点实用拜占庭容错(IMPBFT)共识机制。首先,通过节点的共识轮数、存在拜占庭行为的共识轮数以及节点被赋予的优先值,计算出节点的有效共识轮数,再依据有效共识轮数的大小选出多个主节点。其次,对原共识机制进行改进,使所有节点利用改进的机制进行共识。最后,引入流水线来实现IMPBFT共识的并发执行。在进行流水线操作时,不同轮共识的多阶段消息统一签名,并且不再使用固定周期来控制流水线。理论研究和实验结果表明,IMPBFT的多主节点结构相较单一主节点的共识结构更加安全稳定;与平方级通信量的PBFT和信用委托拜占庭容错(CDBFT)共识相比,IMPBFT将通信量降至线性级;在交易吞吐量、扩展性和交易时延方面,IMPBFT的性能要优于PBFT和CDBFT;使用“多阶段消息统一签名、无固定周期”流水线的IMPBFT,比未使用流水线的IMPBFT在交易吞吐量上提高了75.2%。

    先进计算
    基于长-短时序特征融合的资源负载预测模型
    王艺霏, 于雷, 滕飞, 宋佳玉, 袁玥
    2022, 42(5):  1508-1515.  DOI: 10.11772/j.issn.1001-9081.2021030393
    摘要 ( )   HTML ( )   PDF (2857KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    高准确率的资源负载预测能够为实时任务调度提供依据,从而降低能源消耗。但是,针对资源负载的时间序列的预测模型,大多是通过提取时间序列的长时序依赖特性来进行短期或者长期预测,忽略了时间序列中的短时序依赖特性。为了更好地对资源负载进行长期预测,提出了一种基于长-短时序特征融合的边缘计算资源负载预测模型。首先,利用格拉姆角场(GAF)将时间序列转变为图像格式数据,以便利用卷积神经网络(CNN)来提取特征;然后,通过卷积神经网络提取空间特征和短期数据的特征,用长短期记忆(LSTM)网络来提取时间序列的长时序依赖特征;最后,将所提取的长、短时序依赖特征通过双通道进行融合,从而实现长期资源负载预测。实验结果表明,所提出的模型在阿里云集群跟踪数据集CPU资源负载预测中的平均绝对误差(MAE)为3.823,均方根误差(RMSE)为5.274,拟合度(R2)为0.815 8,相较于单通道的CNN和LSTM模型、双通道CNN+LSTM和ConvLSTM+LSTM模型,以及资源负载预测模型LSTM-ED和XGBoost,所提模型的预测准确率更高。

    基于正交自适应鲸鱼优化的云计算任务调度
    张金泉, 徐寿伟, 李信诚, 王重洋, 徐景芝
    2022, 42(5):  1516-1523.  DOI: 10.11772/j.issn.1001-9081.2021050806
    摘要 ( )   HTML ( )   PDF (1821KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对任务调度中存在的任务完成时间长、系统执行任务成本高且系统负载不均衡等问题,提出了一种基于正交自适应鲸鱼优化算法(OAWOA)的云计算任务调度方法。首先,将正交试验设计(OED)应用于种群初始化和全局搜索阶段,以提升和维持种群的多样性,避免算法过早陷入局部收敛状态;然后,利用自适应指数递减因子和双向搜索机制,来进一步加强算法的全局搜索能力;最后,对适应度函数进行优化,从而使算法实现多目标优化。通过仿真实验将所提的算法与鲸鱼优化算法(WOA)、粒子群优化(PSO)算法、蝙蝠算法(BA)以及其他两种改进的WOA进行比较。实验结果表明,在任务规模为50和500时所提算法都取得了更好的收敛效果,并且得到的系统执行任务的总时间和总成本均低于其他几种算法,同时负载均衡度仅低于BA。可见,所提算法在降低系统执行任务的总时间和总成本以及提高系统负载均衡方面均表现出了显著的优势。

    基于阵列处理器的最小均方误差检测算法并行设计与实现
    刘帅, 蒋林, 李远成, 山蕊, 朱育琳, 王欣
    2022, 42(5):  1524-1530.  DOI: 10.11772/j.issn.1001-9081.2021030460
    摘要 ( )   HTML ( )   PDF (1972KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对大规模多输入多输出(MIMO)系统中,最小均方误差(MMSE)检测算法在可重构阵列结构上适应性差、计算复杂度高和运算效率低的问题,基于项目组开发的可重构阵列处理器,提出了一种基于MMSE算法的并行映射方法。首先,利用Gram矩阵计算时较为简单的数据依赖关系,设计时间上和空间上可以高度并行的流水线加速方案;其次,根据MMSE算法中Gram矩阵计算和匹配滤波计算模块相对独立的特点,设计模块化并行映射方案;最后,基于Xilinx Virtex-6开发板对映射方案进行实现并统计其性能。实验结果表明,该方法在MIMO规模为128×4128×8128×16的正交相移键控(QPSK)上行链路中,加速比分别2.80、4.04和5.57;在128×16的大规模MIMO系统中,可重构阵列处理器比专用硬件减少了42.6%的资源消耗。

    指数函数多项式的实根分离算法
    葛昕钰, 陈世平, 刘忠
    2022, 42(5):  1531-1537.  DOI: 10.11772/j.issn.1001-9081.2021030440
    摘要 ( )   HTML ( )   PDF (503KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对超越函数多项式的实根分离问题,提出了一种指数函数多项式的区间分离算法exRoot,将非多项式型实函数的实根分离问题转化为多项式正负性判定问题进而对其求解。首先,利用泰勒替换法构造目标函数的多项式区间套;然后,将指数函数的求根问题转化为多项式在区间内正负性的判定问题;最后,给出综合算法,并且试探性地应用于实特征值线性系统的可达性判定问题。所提算法在Maple中实现,输出的结果可读,且高效易行。区别于HSOLVER和数值计算方法fsolve,exRoot回避了直接讨论根的存在性问题,理论上具有终止性和完备性,且可达到任意精度,应用于最优化问题时可避免数值解带来的系统误差。

    网络与通信
    基于终端直通通信的多用户计算卸载资源优化决策
    李余, 何希平, 唐亮贵
    2022, 42(5):  1538-1546.  DOI: 10.11772/j.issn.1001-9081.2021030458
    摘要 ( )   HTML ( )   PDF (2244KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着计算密集和时延敏感类应用的激增,移动边缘计算(MEC)被提出应用在网络边缘为用户提供计算服务。针对基站(BS)端边缘服务器计算资源有限以及网络边缘用户远距离计算卸载的时延较长等问题,提出了基于终端直通(D2D)通信的多用户计算卸载资源优化决策,将D2D融入MEC网络使用户以D2D方式直接卸载任务到相邻用户处执行,从而能够进一步降低卸载时延和能耗。首先,以最小化包括时延和能耗的系统计算总开销为优化目标,建模多用户计算卸载和多用户计算资源分配的联合优化问题;然后,将求解该问题看作是一个D2D配对过程,并提出基于稳定匹配的低复杂度的多用户计算卸载资源优化决策算法;最后,迭代求解D2D卸载的优化分配决策。通过理论证明分析了所提算法的稳定性、最优性和复杂度等特性。仿真结果表明,所提算法相较于随机匹配算法能够有效降低10%~33%的系统计算总开销,并且其性能非常接近最优的穷举搜索算法。可见,所提基于D2D卸载的决策有利于改善时延和能耗开销性能。

    传染病在多层星型耦合网络上的资源控制
    张斯, 张必山, 马忠军
    2022, 42(5):  1547-1553.  DOI: 10.11772/j.issn.1001-9081.2021030491
    摘要 ( )   HTML ( )   PDF (2054KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对已有传染病传播模型没有考虑到具体的特殊网络结构与资源因素对控制疫情爆发的影响与作用机制,结合双层星型耦合网络与传染病SIS模型,建立了一个离散动态传播模型。该模型利用星型网络的结构特性与平均度概念推导各层感染人口比例关于资源及各种参数的离散方程。理论分析和仿真实验结果表明,多层星型耦合传染病传播网络中存在资源阈值,当节点为叶子节点时,网络存在两个资源阈值,增加资源量投入以抑制传染病传播只在两个资源阈值间有效,此时传染病感染人口比例随着投入资源的增加而减少;当节点为中心节点时,网络中的资源阈值随其他层感染人口比例的增大由两个减少至一个。此外,层间中心节点耦合强度、层间叶子节点耦合强度对疫情的控制效果随着节点所处位置的不同而不同。

    计算机软件技术
    基于特征选择和TrAdaBoost的跨项目缺陷预测方法
    李莉, 石可欣, 任振康
    2022, 42(5):  1554-1562.  DOI: 10.11772/j.issn.1001-9081.2021050867
    摘要 ( )   HTML ( )   PDF (2257KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    跨项目软件缺陷预测可以解决预测项目中训练数据较少的问题,然而源项目和目标项目通常会有较大的数据分布差异,这降低了预测性能。针对该问题,提出了一种基于特征选择和TrAdaBoost的跨项目缺陷预测方法(CPDP-FSTr)。首先,在特征选择阶段,采用核主成分分析法(KPCA)删除源项目中的冗余数据;然后,根据源项目和目标项目的属性特征分布,按距离选出与目标项目分布最接近的候选源项目数据;最后,在实例迁移阶段,通过采用评估因子改进的TrAdaBoost方法,在源项目中找出与目标项目中少量有标签实例分布相近的实例,并建立缺陷预测模型。以F1作为评价指标,与基于特征聚类和TrAdaBoost的跨项目软件缺陷预测(FeCTrA)方法以及基于多核集成学习的跨项目软件缺陷预测(CMKEL)方法相比,CPDP-FSTr的预测性能在AEEEM数据集上分别提高了5.84%、105.42%,在NASA数据集上分别提高了5.25%、85.97%,且其两过程特征选择优于单一特征选择过程。实验结果表明,当源项目特征选择比例和目标项目有类标实例比例分别为60%、20%时,所提CPDP-FSTr能取得较好的预测性能。

    多媒体计算与计算机仿真
    基于多通道注意力机制的图像超分辨率重建网络
    张晔, 刘蓉, 刘明, 陈明
    2022, 42(5):  1563-1569.  DOI: 10.11772/j.issn.1001-9081.2021030498
    摘要 ( )   HTML ( )   PDF (3016KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的图像超分辨率重建方法存在生成图像纹理扭曲、细节模糊等问题,提出了一种基于多通道注意力机制的图像超分辨率重建网络。首先,该网络中的纹理提取模块通过设计多通道注意力机制并结合一维卷积实现跨通道的信息交互,以关注重要特征信息;然后,该网络中的纹理恢复模块引入密集残差块来尽可能恢复部分高频纹理细节,从而提升模型性能并产生优质重建图像。所提网络不仅能够有效提升图像的视觉效果,而且在基准数据集CUFED5上的结果表明所提网络与经典的基于卷积神经网络的超分辨率重建(SRCNN)方法相比,峰值信噪比(PSNR)和结构相似度(SSIM)分别提升了1.76 dB和0.062。实验结果表明,所提网络可提高纹理迁移的准确性,并有效提升生成图像的质量。

    基于并联卷积与残差网络的图像超分辨率重建
    王汇丰, 徐岩, 魏一铭, 王会真
    2022, 42(5):  1570-1576.  DOI: 10.11772/j.issn.1001-9081.2021050742
    摘要 ( )   HTML ( )   PDF (2730KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的图像超分辨率重建算法可以改善图像整体视觉效果或者提升重建图像的客观评价值,然而对图像感知效果和客观评价值的均衡提升效果不佳,且重建图像缺乏高频信息,导致纹理模糊。针对上述问题,提出了一种基于并联卷积与残差网络的图像超分辨率重建算法。首先,以并联结构为整体框架,在并联结构上采用不同卷积组合来丰富特征信息,并加入跳跃连接来进一步丰富特征信息并融合输出,从而提取更多的高频信息。其次,引入自适应残差网络以补充信息并优化网络性能。最后,采用感知损失来提升恢复后图像的整体质量。实验结果表明,相较于超分辨率卷积神经网络(SRCNN)、深度超分辨率重建网络(VDSR)和超分辨率生成对抗网络(SRGAN)等算法,所提算法在重建图像上有更好的表现,其放大效果图的细节纹理更清晰。在客观评价上,所提算法在4倍重建时的峰值信噪比(PSNR)和结构相似性(SSIM)相较于SRGAN分别平均提升了0.25 dB和0.019。

    基于半监督学习的单幅图像去雨算法
    邱永茹, 姚光乐, 冯杰, 崔昊宇
    2022, 42(5):  1577-1582.  DOI: 10.11772/j.issn.1001-9081.2021030492
    摘要 ( )   HTML ( )   PDF (3937KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在雨天采集的图像通常存在背景物体被雨纹遮挡、图像变形等影响图像质量的现象,对后续图像分析及应用造成严重影响。近年来,已经提出了许多基于深度学习的去雨算法并获得了较好的效果。由于真实雨图的无雨纹干净背景图采集非常困难,大多数算法都采用监督学习即在含有配对标签的合成雨图数据集上进行模型训练。由于合成雨图和真实雨图中雨纹的亮度、透明度、形状等存在巨大差异,基于监督学习的去雨算法对真实雨图的泛化能力普遍较差。为提高去雨模型对真实雨图的去雨效果,提出了一种基于半监督学习的单幅图像去雨算法。该算法在模型训练过程中加入合成雨图和真实雨图并最小化两个输入图像转换成的特征向量的一阶信息和二阶统计信息差异,使两者特征分布一致。同时,针对雨纹复杂多样的特点,引入多尺度网络以获取更丰富的图像特征,并提高模型性能。实验结果表明,所提算法在Rain100H合成雨图测试集上相较JDNet、Syn2Real等算法在峰值信噪比(PSNR)和结构相似度(SSIM)上分别至少提升了0.66 dB、0.01,在去除雨纹的同时能最大限度保留图像细节和颜色信息;并且由于减少了分布差异,该算法在真实雨图测试集上的去雨效果明显优于现有的JDNet、Syn2Real等去雨算法,具有较强的泛化能力。所提算法可以应用于现有的基于监督学习的去雨算法并显著提高其去雨效果,拥有较高的独立性。

    基于Order-Aware网络内点筛选网络的电力巡线航拍图像拼接
    回立川, 李万禹, 陈艺琳
    2022, 42(5):  1583-1590.  DOI: 10.11772/j.issn.1001-9081.2021030493
    摘要 ( )   HTML ( )   PDF (9373KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    电力巡线图像纹理复杂且具有视差变化,针对传统算法获取成对匹配点数量较少、配准精度较低,严重影响电力巡线无人机图像拼接效果等问题,提出了一种基于改进OANet的图像拼接算法。首先,借助加速“风”(AKAZE)算法对待拼接电力巡线图像进行粗匹配;其次,对OANet中Order-Aware模块添加挤压和激励网络(SENet),从而增强网络对局部和全局上下文信息的抓取能力,得到更精确的成对匹配点;然后,通过MPA算法配准待拼接图像;最后,借助内容压缩感知算法计算重叠区域的最佳缝合线以完成图像拼接。改进OANet相较原OANet的正确匹配点数量增加了10%左右,耗时平均增加了10 ms;与APAP算法、AANAP算法、MPA算法等配准拼接算法相比,所提算法的拼接质量最好,其待拼接图像的重叠区域的均方根误差为0,非重叠区域未发生畸变。实验结果表明,所提算法可快速、稳定地拼接电力巡线航拍图像。

    基于输电杆塔区域提取的图像匹配算法
    郭可贵, 曹瑞, 万能, 汪晓, 尹悦, 唐旭明, 熊军林
    2022, 42(5):  1591-1597.  DOI: 10.11772/j.issn.1001-9081.2021050796
    摘要 ( )   HTML ( )   PDF (3145KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对无人机(UAV)视觉定位过程中传统特征提取与匹配算法匹配质量不佳的问题,提出了一种基于输电杆塔区域提取的图像匹配算法。首先,将图像划分为若干相互重叠的网格区域,并对每个区域采用双层金字塔结构提取特征点,从而保证特征点的均匀分布;其次,使用直线分割检测(LSD)算法提取图像中的直线,从而利用输电杆塔的特殊结构得到输电杆塔的支撑区域;最后,在连续图像中对输电杆塔区域与背景区域内的特征点分别进行匹配,以进一步估计相机运动。在旋转和平移估计实验中,与传统的ORB特征提取与匹配算法相比,所提算法的特征匹配准确率提升了10.1个百分点,相对位姿误差的均值降低了0.049;在UAV巡检实验中,采用所提算法进行UAV轨迹估计的相对误差为2.89%,表明该算法可在实时绕塔飞行过程中实现对UAV位姿的鲁棒、精确估计。

    基于Kinect v4的牛体尺测量方法
    赵建敏, 赵成, 夏海光
    2022, 42(5):  1598-1606.  DOI: 10.11772/j.issn.1001-9081.2021030532
    摘要 ( )   HTML ( )   PDF (3608KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对基于机器视觉的牛体尺测量方法中图像背景复杂、特征点提取难度大的问题,提出了一种基于Kinect v4传感器的牛体尺测量方法来采集彩色和深度图像,并结合目标检测、Canny边缘检测、三点圆弧曲率等算法提取体征特征点进而计算体尺数据。首先,制作了牛体尺特征部位图像数据集,并利用深度学习YOLOv5目标检测算法检测牛体尺特征部位信息,以减少牛体其他部位和背景对体尺测点提取的干扰;其次,借助OpenCV图像处理库中的Canny边缘检测、轮廓提取等图像处理算法获取牛体尺测点所在的关键轮廓;然后,对关键轮廓采用多项式拟合和三点圆弧曲率等算法从而在二维图像中提取牛体尺测点;最后,利用深度信息将二维图像中的测点信息转换到三维坐标系下,并结合随机抽样一致(RANSAC)算法在三维坐标系下设计牛体尺测量方法。经过在复杂环境下传感器和牛体侧面成不同偏角时的实验测量结果和人工测量结果的比较得出,牛体尺数据中鬐甲高的平均相对误差为0.76%,体斜长的平均相对误差为1.68%,体直长的平均相对误差为2.14%,臀端高的平均相对误差为0.76%。实验结果表明,所提方法在复杂环境下具有较高的测量精度。

    前沿与综合应用
    基于图注意力网络与双阶注意力机制的径流预报模型
    胡鹤轩, 隋华超, 胡强, 张晔, 胡震云, 马能武
    2022, 42(5):  1607-1615.  DOI: 10.11772/j.issn.1001-9081.2021050829
    摘要 ( )   HTML ( )   PDF (2505KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了提高流域径流量预报的准确率,考虑数据驱动水文模型缺乏模型透明度与物理可解释性的问题,提出了一种使用图注意力网络与基于长短期记忆网络(LSTM)的双阶注意力机制(GAT-DALSTM)模型来进行径流预报。首先,以流域站点的水文资料为基础,引入图神经网络提取流域站点的拓扑结构并生成特征向量;其次,针对水文时间序列数据的特点,建立了基于双阶注意力机制的径流预报模型对流域径流量进行预测,并通过基于注意力系数热点图的模型评估方法验证所提模型的可靠性与透明度。在屯溪流域数据集上,将所提模型与图卷积神经网络(GCN)和长短期记忆网络(LSTM)在各个预测步长下进行比较,实验结果表明,所提模型的纳什效率系数分别平均提高了3.7%和4.9%,验证了GAT-DALSTM径流预报模型的准确性。从水文与应用角度对注意力系数热点图进行分析,验证了模型的可靠性与实用性。所提模型能为提高流域径流量的预测精度与模型透明度提供技术支撑。

    基于双长短期记忆网络组合的网络货运平台成交定价预测模型
    李由之, 胡志华, 陈春, 杨培蓓, 董雅静
    2022, 42(5):  1616-1623.  DOI: 10.11772/j.issn.1001-9081.2021030504
    摘要 ( )   HTML ( )   PDF (2220KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    网络货运平台运输服务订单的成交定价的预测结果是平台运营策略和承运人决策的直接体现,显著影响平台效益和承运人市场健康发展。以顺丰速递网络货运平台为例,通过缺失值处理和类别型数据转换进行数据预处理。针对网络货运平台成交定价预测精度问题,设计了基于双长短期记忆网络(LSTM)组合的网络货运平台成交定价预测模型,并采用K-means聚类分析预测结果。双LSTM组合模型相较于LSTM、支持向量回归(SVR)、两者相融合的LSTM-SVR以及基于灰色GM(1,1)和反向传播(BP)组合(GM(1,1)-BP)等模型,平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)最低且R2最高,分别为9.90、402.54、1.48和0.999 97。而K-means聚类分析对预测的订单成交定价进行评级的结果与实际情况一致。实验结果表明,所提出的双LSTM组合模型具备有效性和准确的网络货运平台成交定价预测效果。

    基于改进遗传算法和图神经网络的股市波动预测方法
    李晓寒, 贾华丁, 程雪, 李太勇
    2022, 42(5):  1624-1633.  DOI: 10.11772/j.issn.1001-9081.2021030519
    摘要 ( )   HTML ( )   PDF (1762KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对支持向量机(SVM)、长短期记忆(LSTM)网络等智能算法在股市波动预测过程中股票评价特征选择困难及时序关系维度特征缺失的问题,为能够准确预测股票波动、有效防范金融市场风险,提出了一种基于改进遗传算法(IGA)和图神经网络(GNN)的股市波动预测方法——IGA-GNN。首先,利用相邻交易日间的时序关系构建股市交易指标图数据;其次,通过评价指标特性优化交叉、变异概率来改进遗传算法(GA),从而实现节点特征选择;然后,建立图数据的边与节点特征的权重矩阵;最后,运用GNN进行图数据节点的聚合与分类,实现了股市波动预测。在实验阶段,所研究的股票总评价指标数为130个,其中IGA在GNN方法下提取的有效评价指标87个,使指标数量降低了33.08%。应用所提IGA在智能算法中进行特征提取,得到的算法与未进行特征提取的智能算法相比,预测准确率整体提升了7.38个百分点;而与应用传统GA进行智能算法的特征提取相比,应用所提IGA进行智能算法的特征提取的总训练时间缩短了17.97%。其中,IGA-GNN方法的预测准确率最高,相较未进行特征提取的GNN方法的预测准确率整体提高了19.62个百分点;而该方法与用传统GA进行特征提取的GNN方法相比,训练时间平均缩短了15.97%。实验结果表明,所提方法可对股票特征进行有效提取,预测效果较好。

    基于改进的遗传算法的有刷直流电机PID参数整定
    刘延飞, 彭征, 王艺辉, 王忠
    2022, 42(5):  1634-1641.  DOI: 10.11772/j.issn.1001-9081.2021050745
    摘要 ( )   HTML ( )   PDF (3093KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对有刷直流(DC)电机的比例积分微分(PID)参数整定工作复杂耗时的问题,提出了一种基于改进型遗传算法(GA)的PID参数整定方法。首先,提出了适应度增强淘汰法则,改进了传统GA的选择过程;然后,提出了基因感染交叉方法,保证了进化过程中平均适应度值的增加;最后,删除了传统GA中不必要的复制操作,提升了算法的运行速度。通过电机传递函数进行建模和仿真分析。实验结果表明,与常规整定方法相比,所提改进型GA能够显著提升PID参数整定效果,且改进型GA相较于传统GA,达到同样进化效果所需的进化代数减少了79%,算法运行速度提升了4.1%。所提出的改进型GA从选择和交叉两个关键操作步骤对GA进行了改进,并应用于PID参数整定使得上升时间更少、稳定时间更短、过冲更小。

    基于局部策略交互探索的深度确定性策略梯度的工业过程控制方法
    邓绍斌, 朱军, 周晓锋, 李帅, 刘舒锐
    2022, 42(5):  1642-1648.  DOI: 10.11772/j.issn.1001-9081.2021050716
    摘要 ( )   HTML ( )   PDF (2120KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了实现对非线性、滞后性和强耦合的工业过程稳定精确的控制,提出了一种基于局部策略交互探索的深度确定性策略梯度(LPIE-DDPG)的控制方法用于深度强化学习的连续控制。首先,使用深度确定性策略梯度(DDPG)算法作为控制策略,从而极大地减小控制过程中的超调和振荡现象;同时,使用原控制器的控制策略作为局部策略进行搜索,并以交互探索规则进行学习,提高了学习效率和学习稳定性;最后,在Gym框架下搭建青霉素发酵过程仿真平台并进行实验。仿真结果表明,相较于DDPG,LPIE-DDPG在收敛效率上提升了27.3%;相较于比例-积分-微分(PID),LPIE-DDPG在温度控制效果上有更少的超调和振荡现象,在产量上青霉素浓度提高了3.8%。可见所提方法能有效提升训练效率,同时提高工业过程控制的稳定性。

2022年 42卷 11期
刊出日期: 2022-11-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会