《计算机应用》唯一官方网站

联邦学习通信开销研究综述

邱鑫源, 叶泽聪, 崔翛龙, 高志强

2022, 42(2): 333-342. DOI: 10.11772/j.issn.1001-9081.2021020232

摘要 ( )

HTML ( )

PDF (1356KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为了解决数据共享需求与隐私保护要求之间不可调和的矛盾，联邦学习应运而生。联邦学习作为一种分布式机器学习，其中的参与方与中央服务器之间需要不断交换大量模型参数，而这造成了较大通信开销；同时，联邦学习越来越多地部署在通信带宽有限、电量有限的移动设备上，而有限的网络带宽和激增的客户端数量会使通信瓶颈加剧。针对联邦学习的通信瓶颈问题，首先分析联邦学习的基本工作流程；然后从方法论的角度出发，详细介绍基于降低模型更新频率、模型压缩、客户端选择的三类主流方法和模型划分等特殊方法，并对具体优化方案进行深入的对比分析；最后，对联邦学习通信开销技术研究的发展趋势进行了总结和展望。

元学习的不确定性特征构建及初步分析

李艳, 郭劼, 范斌

2022, 42(2): 343-348. DOI: 10.11772/j.issn.1001-9081.2021071198

摘要 ( )

HTML ( )

PDF (483KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

元学习即应用机器学习的方法（元算法）寻求问题的特征（元特征）与算法相对性能测度间的映射，从而形成元知识的学习过程，如何构建和提取元特征是其重要的研究内容。针对目前相关研究所用到的元特征大部分是数据的统计特征的问题，提出不确定性建模并研究不确定性对于学习系统的影响。根据样本的不一致性、边界的复杂性、模型输出的不确定性、线性可分度、属性的重叠度以及特征空间的不确定性，建立了六种数据或模型的不确定性元特征；同时，从不同角度衡量学习问题本身的不确定性大小，并给出了具体的定义。在大量分类问题的人工数据和真实数据集上实验分析了这些元特征之间的相关性，并使用K最近邻（KNN）等多个分类算法对元特征与测试精度之间的相关度进行初步分析。结果表明相关度平均在0.8左右，可见这些元特征对学习性能具有显著影响。

基于中心核对齐的多核单类支持向量机

祁祥洲, 邢红杰

2022, 42(2): 349-356. DOI: 10.11772/j.issn.1001-9081.2021071230

摘要 ( )

HTML ( )

PDF (608KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

多核学习（MKL）方法在分类及回归任务中均取得了优于单核学习方法的性能，但传统的MKL方法均用于处理两类或多类分类问题。为了使MKL方法适用于处理单类分类（OCC）问题，提出了基于中心核对齐（CKA）的单类支持向量机（OCSVM）。首先利用CKA计算每个核矩阵的权重，然后将所得权重用作线性组合系数，进而将不同类型的核函数加以线性组合以构造组合核函数，最后将组合核函数引入到传统OCSVM中代替单个核函数。该方法既能避免核函数的选取问题，又能提高泛化性能和抗噪声能力。在20个UCI基准数据集上与其他五种相关方法进行了实验比较，结果表明该方法在13个数据集上的几何均值（g-mean）均高于其他对比方法，而传统的单核OCSVM仅在2个数据集上的效果较好，局部多核单类支持向量机（LMKOCSVM）和基于核目标对齐的多核单类支持向量机（KTA-MKOCSVM）在5个数据集上的分类效果较好。因此，通过实验比较充分验证了所提方法的有效性。

融合全局结构信息的拓扑优化图卷积网络

富坤, 高金辉, 赵晓梦, 李佳宁

2022, 42(2): 357-364. DOI: 10.11772/j.issn.1001-9081.2021030380

摘要 ( )

HTML ( )

PDF (1079KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

基于拓扑优化的图卷积网络（TOGCN）是一类图卷积神经网络（GCNN）模型，它通过网络中的辅助信息优化网络拓扑结构，有利于反映节点间的联系程度；然而TOGCN模型仅注重局部节点之间的关联关系，对网络潜在的全局结构信息关注不足。融合全局特征信息，有助于提高模型的性能和处理信息缺失时的鲁棒性。提出了融合全局结构信息的拓扑优化图卷积网络（GE-TOGCN）模型，该模型一方面利用相邻节点的属性对拓扑图进行优化；另一方面使用类信息作为网络的全局结构信息，从而保持类内聚合性和类间分离性。首先根据标记节点计算类中心向量；然后利用部分未标记节点来更新类中心向量；最后将所有节点根据其与类中心向量的相似度分配到对应的类中，并通过一个半监督损失函数优化各类的类中心向量与节点的最终表示向量。在Cora、Citeseer数据集上，在标签信息缺失的情况下运用得到的节点表示向量进行了节点分类任务与节点可视化任务。实验结果表明，GE-TOGCN模型与图卷积网络（GCN）、图学习卷积网络（GLCN）等模型相比，在Cora数据集上的分类准确率提高了1.2~12.0个百分点，在Citeseer数据集上的分类准确率提高了0.9~9.9个百分点；而在节点可视化任务中所提模型的类内节点聚合程度更高，类簇之间的边界更明显。可见，融合类全局信息能减少标签信息缺失对模型学习效果的不良影响，且该模型得到的节点表示在下游任务中表现出了更好的性能。

基于小样本无梯度学习的卷积结构预训练模型性能优化方法

李亚鸣, 邢凯, 邓洪武, 王志勇, 胡璇

2022, 42(2): 365-374. DOI: 10.11772/j.issn.1001-9081.2021020230

摘要 ( )

HTML ( )

PDF (841KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对卷积结构的深度学习模型在小样本学习场景中泛化性能较差的问题，以AlexNet和ResNet为例，提出一种基于小样本无梯度学习的卷积结构预训练模型的性能优化方法。首先基于因果干预对样本数据进行调制，由非时序数据生成序列数据，并基于协整检验从数据分布平稳性的角度对预训练模型进行定向修剪；然后基于资本资产定价模型（CAPM）以及最优传输理论，在预训练模型中间输出过程中进行无需梯度传播的正向学习并构建一种全新的结构，从而生成在分布空间中具有明确类间区分性的表征向量；最后基于自注意力机制对生成的有效特征进行自适应加权处理，并在全连接层对特征进行聚合，从而生成具有弱相关性的embedding向量。实验结果表明所提出的方法能够使AlexNet和ResNet卷积结构预训练模型在ImageNet 2012数据集的100类图片上的Top-1准确率分别从58.82%、78.51%提升到68.50%、85.72%，可见所提方法能够基于小样本训练数据有效提高卷积结构预训练模型的性能。

迭代直觉模糊K-modes算法

陈育丹, 高翠芳, 沈莞蔷, 殷萍

2022, 42(2): 375-381. DOI: 10.11772/j.issn.1001-9081.2021030383

摘要 ( )

HTML ( )

PDF (581KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

直觉模糊K-modes（IFKM）算法在聚类过程中采用简单0-1匹配相似性度量，既无法有效刻画类内数据对象之间的相似性，也未体现不同属性在聚类过程中的贡献程度；此外，IFKM算法在聚类的每一次迭代中直接根据直觉模糊隶属度矩阵来确定数据对象所属类别，没有充分发挥直觉模糊思想的作用。为了解决这两个问题，提出一种迭代IFKM （IIFKM）算法。首先，基于直觉模糊熵（IFE）与直觉模糊集（IFS）定义了一种加权的直觉模糊隶属度相似性度量；其次，将直觉模糊隶属度矩阵作为迭代信息贯穿于整个聚类过程，使算法中的直觉模糊思想得到充分体现。在UCI数据库的5个数据集上进行的实验结果表明，与IFKM算法相比，IIFKM算法在分类正确率和召回率方面提升了7%~11%，在分类精度方面也有一定提升。

变精度邻域等价粒的邻域决策树构造算法

谢鑫, 张贤勇, 王旋晔, 唐鹏飞

2022, 42(2): 382-388. DOI: 10.11772/j.issn.1001-9081.2021071168

摘要 ( )

HTML ( )

PDF (541KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有决策树算法对连续性数据分类的信息丢失、效果不佳等缺点，提出一种邻域决策树（NDT）构造算法。首先，挖掘了邻域决策信息系统上的变精度邻域等价粒，并探讨了相关性质；然后基于变精度邻域等价粒构建邻域基尼指数度量，以度量邻域决策信息系统的不确定性；最后，用邻域基尼指数度量诱导出树节点的选取条件，并以变精度邻域等价粒为树分裂规则，从而构建NDT。在UCI数据集进行实验的结果表明，NDT算法的准确度比基于信息熵的决策树算法ID3、基于基尼指数的决策树算法CART、基于信息增益率的决策树（C4.5）算法和融合信息增益和基尼指数（IGGI）算法平均提高了20个百分点左右，验证了NDT算法的有效性。

基于哈希学习的投票样例选择算法

黄雅婕, 翟俊海, 周翔, 李艳

2022, 42(2): 389-394. DOI: 10.11772/j.issn.1001-9081.2021071188

摘要 ( )

HTML ( )

PDF (574KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着数据的海量型增长，如何存储并利用数据成为目前学术研究和工业应用等方面的热门问题。样例选择是解决此类问题的方法之一，它在原始数据中依据既定规则选出代表性的样例，从而有效地降低后续工作的难度。基于此，提出一种基于哈希学习的投票样例选择算法。首先通过主成分分析（PCA）方法将高维数据映射到低维空间；然后利用k-means算法结合矢量量化方法进行迭代运算，并将数据用聚类中心的哈希码表示；接着将分类后的数据按比例进行随机选择，在多次独立运行算法后投票选择出最终的样例。与压缩近邻（CNN）算法和大数据线性复杂度样例选择算法LSH-IS-F相比，所提算法在压缩比方面平均提升了19%。所提算法思想简单容易实现，能够通过调节参数自主控制压缩比。在7个数据集上的实验结果显示所提算法在测试精度相似的情况下在压缩比和运行时间方面较随机哈希有较大优势。

基于多列卷积神经网络的参数异步更新算法

陈薪羽, 刘明哲, 任俊, 汤影

2022, 42(2): 395-403. DOI: 10.11772/j.issn.1001-9081.2021020367

摘要 ( )

HTML ( )

PDF (4787KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有人群计数算法采用同步人工优化深度学习网络，忽略了网络学习的负面信息，导致大量冗余参数甚至过拟合，进而影响到计数准确性的问题，提出基于多列卷积神经网络MCNN（Multi-column Convolution Neural Network）的参数异步更新算法。首先将单帧图像输入网络，经过三列卷积分别提取不同尺度特征，通过列之间的交互信息学习两列间特征图的关联性；接着，根据优化的交互信息及更新的损失函数异步更新每列参数直至算法收敛；最后采用动态卡尔曼滤波将每列输出密度图进行深度融合，并对融合的密度图中所有像素求和得到图像总人数。实验结果表明，所提算法在UCSD（University of California San Diego）数据集上的平均绝对误差（MAE）比该数据集上最优MAE表现的ic-CNN+McML（Iterative Crowd Counting Convolution Neural Network Multi-column Mutual Learning）减小了1.1%，均方误差（MSE）比该数据集上最优MSE表现的CP-CNN（Contextual Pyramid Convolution Neural Network）减小了4.3%；所提算法在ShanghaiTech Part_A数据集上的MAE比该数据集上最优MAE表现的ic-CNN+McML减小了1.7%，MSE比该数据集上最优MSE表现的ACSCP（Adversarial Cross-Scale Consistency Pursuit）减小了3.2%；在ShanghaiTech Part_B数据集上的MAE和MSE分别比该数据集上最优MAE和MSE表现的ic-CNN+McML减小了18.3%、35.2%；在UCF_CC_50（University of Central Florida Crowd Counting）数据集上的MAE和MSE分别比该数据集上最优MAE和MSE表现的ic-CNN+McML减小了1.9%、9.8%。可见，该算法能有效提高人群计数的准确性和鲁棒性，且允许输入图像具有任意大小或分辨率，能适应检测目标的大尺度变换。

基于卷积神经网络交互的用户属性偏好建模的推荐模型

潘仁志, 钱付兰, 赵姝, 张燕平

2022, 42(2): 404-411. DOI: 10.11772/j.issn.1001-9081.2021041070

摘要 ( )

HTML ( )

PDF (633KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

潜在因子模型（LFM）以其优异的性能在推荐领域得到了广泛应用。在LFM中除了使用交互数据以外，辅助信息也被引入用于解决数据稀疏的问题，从而提升推荐的性能。然而，大多数LFM仍然存在一些问题：第一，LFM在对用户进行建模时，忽略了用户如何根据其特征偏好对项目作出决策；第二，采用内积的特征交互假设特征维度之间是相互独立的，而没有考虑到特征维度之间的关联。针对上述问题，提出一种新的推荐模型：基于卷积神经网络（CNN）交互的用户属性偏好建模的推荐模型（UAMC）。该模型首先获得用户的一般偏好、用户属性和项目嵌入，然后将用户属性和项目嵌入进行交互，以探索用户不同的属性对不同项目的偏好；接着将交互过的用户偏好属性送入CNN层来探索不同偏好属性的不同维度的关联，从而得到用户的属性偏好向量；接着使用注意力机制结合用户的一般偏好和CNN层得到的属性偏好，从而获得用户的向量表示；最后采用点积来计算用户对项目的评分。在Movielens-100K、Movielens-1M和Book-crossing这三个真实的数据集上进行了实验。实验结果表明，所提模型在均方根误差（RMSE）上与稀疏数据预测的神经网络分解机（NFM）模型相比分别降低了1.75%、2.78%和0.25%，验证了在LFM的评分预测推荐中，UAMC在提升推荐精度上的有效性。

近似概念的遗传生成算法及其推荐应用

刘忠慧, 王梓宥, 闵帆

2022, 42(2): 412-418. DOI: 10.11772/j.issn.1001-9081.2021041155

摘要 ( )

HTML ( )

PDF (477KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

由于构造概念格的时间复杂度高，在推荐领域已有研究者提出用概念集合来替代概念格。但目前对概念集合的研究未考虑近似概念的作用，因此将近似概念引入推荐应用，并提出基于遗传算法（GA）的近似概念生成算法（ACGA）和相应的推荐应用方案。首先由启发式方法生成初始概念集合；其次用交叉算子对初始概念集合中的概念的外延两两求交集，从而得到近似概念；然后用选择算子根据外延相似度以及相关阈值筛选出满足条件的近似概念来更新概念集合，而不满足条件的近似概念由变异算子按照用户相似度进行外延调整，直到其满足条件；最后基于新的概念集合，根据邻居用户的偏好向目标用户进行推荐。在4个推荐系统常用的数据集上进行实验，结果表明ACGA生成的近似概念提升了推荐效果，尤其是在2个电影评分数据集上，ACGA与概率矩阵分解（PMF）算法相比，F1值提升了近78%，召回率提升了近104%，精确度提升了近57%；与K最近邻（KNN）算法比较，精确度提升了近12%。

基于多模态深度融合的虚假信息检测

孟杰, 王莉, 杨延杰, 廉飚

2022, 42(2): 419-425. DOI: 10.11772/j.issn.1001-9081.2021071184

摘要 ( )

HTML ( )

PDF (1079KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对虚假信息检测中图片特征提取不充分，以及忽视了单模内关系以及单模与多模之间交互作用的问题，提出一种基于文本和图片信息的多模态深度融合（MMDF）模型。首先，用双向门控循环单元（Bi-GRU）提取文本的丰富语义特征，用多分支卷积-循环神经网络（CNN-RNN）提取图片的多层次特征；然后，建立模间和模内的注意力机制以捕获语言和视觉领域之间的高层交互，并得到多模态的联合表征；最后，将各模态原表征与融合后的多模态联合表征依据注意力权重进行再融合，以加强原信息的作用。该模型与多模态变分自动编码器（MVAE）模型相比，在中国计算机学会（CCF）竞赛和微博数据集上的准确率分别提升了1.9个百分点和2.4个百分点。实验结果表明，所提模型能够充分融合多模态信息，有效提高虚假信息检测的准确率。

注入注意力机制的深度特征融合新闻推荐模型

刘羽茜, 刘玉奇, 张宗霖, 卫志华, 苗冉

2022, 42(2): 426-432. DOI: 10.11772/j.issn.1001-9081.2021050907

摘要 ( )

HTML ( )

PDF (755KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有新闻推荐模型在挖掘新闻特征和用户特征时，往往没有考虑所浏览新闻之间的关系、时序变化以及不同新闻对用户的重要性，从而缺乏全面性；同时，现有模型在新闻更细粒度的内容特征挖掘方面有欠缺。因此构建了一个能够全面而不冗余地进行用户表征并能提取新闻更细粒度片段特征的新闻推荐模型——注入注意力机制的深度特征融合新闻推荐模型。该模型首先采用基于深度学习的方法，通过注入注意力机制的卷积神经网络（CNN）对新闻文本特征矩阵进行深度提取；然后，通过对用户已经浏览的新闻添加时序预测，并注入多头自注意力机制，来提取用户的兴趣特征；最后，使用真实的中文数据集与英文数据集，以收敛时间、平均值倒数秩（MRR）和归一化折现累积收益（nDCG）为指标进行实验。与基于多头自注意力的神经网络新闻推荐（NRMS）模型等进行对比，该模型在中文数据集上nDCG的提升率为-0.22%~4.91%，MRR的提升率为-0.82%~3.48%，而且，与唯一为负提升率的模型相比，收敛时间缩短7.63%；在英文数据集上该模型在nDCG和MRR上的提升率分别为0.07%~1.75%与0.03%~1.30%，且该模型始终具有较快的收敛速度。消融实验的结果表明增加注意力机制与时序模块是有效的。

基于BERT的初等数学文本命名实体识别方法

张毅, 王爽胜, 何彬, 叶培明, 李克强

2022, 42(2): 433-439. DOI: 10.11772/j.issn.1001-9081.2021020334

摘要 ( )

HTML ( )

PDF (689KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在初等数学领域的命名实体识别（NER）中，针对传统命名实体识别方法中词嵌入无法表征一词多义以及特征提取过程中忽略部分局部特征的问题，提出一种基于BERT的初等数学文本命名实体识别方法——BERT-BiLSTM-IDCNN-CRF。首先，采用BERT进行预训练，然后将训练得到的词向量输入到双向长短期记忆（BiLSTM）网络与迭代膨胀卷积网络（IDCNN）中提取特征，再将两种神经网络输出的特征进行合并，最后经过条件随机场（CRF）修正后进行输出。实验结果表明：BERT-BiLSTM-IDCNN-CRF在初等数学试题数据集上的F1值为93.91%，相较于BiLSTM-CRF基准方法的F1值提升了4.29个百分点，相较于BERT-BiLSTM-CRF方法的F1值提高了1.23个百分点；该方法对线、角、面、数列等实体识别的F1值均高于91%，验证了该方法对初等数学实体识别的有效性。此外，在所提方法的基础上结合注意力机制后，该方法的召回率下降了0.67个百分点，但准确率上升了0.75个百分点，注意力机制的引入对所提方法的识别效果提升不大。

分布式资源描述框架数据管理系统查询性能评价

冯钧, 王秉发, 陆佳民

2022, 42(2): 440-448. DOI: 10.11772/j.issn.1001-9081.2021020255

摘要 ( )

HTML ( )

PDF (602KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着知识图谱技术的不断发展，知识图谱驱动的知识信息管理广泛应用于各个领域，因此面向知识图谱的分布式SPARQL（Simple Protocol and Resource description framework Query Language）的查询效率显得尤为重要。首先针对现有的基于Spark和基于主存（RAM）的分布式资源描述框架（RDF）系统进行详细调研；其次，从上述系统中选出8个具有代表性的系统进行查询性能评估，比较基于Spark和基于RAM的系统在不同查询类型、查询直径、数据集上的查询性能差异；然后，全面分析实验结果，对基于Spark和基于RAM的系统的查询性能进行评价；最后，针对现有系统在分布式SPARQL查询中存在的查询伸缩性差、查询连接复杂度高、查询编译时间长等问题，展望面向垂直应用领域的分布式SPARQL查询优化的未来研究方向。

基于局部条件区分能力的高效属性约简算法

康猛, 蒙祖强

2022, 42(2): 449-456. DOI: 10.11772/j.issn.1001-9081.2021071170

摘要 ( )

HTML ( )

PDF (635KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

基于区分矩阵的传统属性约简方法具有直观易理解的优点，但时间和空间复杂度都很高，当数据规模较大或条件属性较多时，会无法快速得到约简结果。为解决该问题，在区分关系的基础上构造了条件区分能力来进行属性选择，提出一种基于条件区分能力的属性约简算法。而为了进一步加快属性重要性的计算、提高约简效率，依据大数定律中频率的稳定性，通过采样的方式将条件区分能力扩展为局部条件区分能力，提出基于局部条件区分能力的属性约简算法。理论证明了条件区分能力在属性的选择上比正区域更严格，并将该算法与基于区分度的高效前向属性约简算法（FAR-DV）、基于k近邻属性重要度和相关系数的属性约简算法（K2NCRS）及基于正区域排序升序决策表的快速正区域约简算法（FPRA）进行了对比。实验结果显示，该算法在属性选择顺序、约简率和分类精度上与FAR-DV基本一致，在约简效率上比上述三种算法提高了10倍以上；且随着数据规模的增大或条件属性的增多，在约简效率上的提升越明显。可以看出，所提算法具有更低的时空复杂度，适用于海量数据属性约简。

可解释性有序聚类方法及其应用分析

高苏, 鲍君忠, 王昕, 王利东

2022, 42(2): 457-462. DOI: 10.11772/j.issn.1001-9081.2021050871

摘要 ( )

HTML ( )

PDF (3370KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对管理决策领域中的等级分析问题，构建了面向语义可解释性的有序聚类方法。首先，在获得样本的优势度的基础上，结合模糊描述和K-modes聚类方法建立海员幸福感指数的有序聚类方法；然后，在公理模糊集框架下对有序聚类结果赋予相应的语义解释，以此形成一种从定量到定性的决策辅助方法；最后，以我国海员职业幸福感指数的9 175份有效调查问卷为研究样本，通过所构建的有序聚类方法得到海员职业幸福感指数的等级划分及其相应的语义描述，并分析了影响海员职业幸福感指数的内在原因。分析表明，所提方法不仅可以产生满足用户指定约束的有序聚类结果，而且聚类结果具有可解释性、可理解性，同时具有良好的辅助决策的价值。

属性集变化条件下集值决策信息系统的增量属性约简方法

刘超, 王磊, 杨文, 钟强强, 黎敏

2022, 42(2): 463-468. DOI: 10.11772/j.issn.1001-9081.2021051024

摘要 ( )

HTML ( )

PDF (511KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为了解决集值决策信息系统中的属性数量不断发生动态变化时，静态属性约简方法无法高效更新属性约简的问题，提出一种以知识粒度为启发信息的增量式属性约简方法。首先，介绍集值决策信息系统的相关概念，接着介绍知识粒度的定义并将其矩阵表示方法推广到此系统中；然后，分析增量式约简的更新机制，并基于知识粒度设计了增量式属性约简方法；最后，选取了3个不同的数据集进行实验。当3个数据集的属性数由20%增加到100%时，传统的非增量式方法的约简耗时分别为54.84 s、108.01 s、565.93 s，增量式方法的约简耗时分别为7.57 s、4.85 s、50.39 s。实验结果表明，在不影响属性约简精度的前提下，所提出的增量式方法比非增量式方法更加快速。

基于确定性因子的启发式属性值约简模型

余顺坤, 闫泓序

2022, 42(2): 469-474. DOI: 10.11772/j.issn.1001-9081.2021071344

摘要 ( )

HTML ( )

PDF (948KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有属性值约简模型程序复杂，难以实现，而且模型所提取的关键信息往往过于追求简明，会削弱决策系统的表达能力。为解决以上问题，提出一种基于确定性因子的启发式属性值约简模型。首先，构造几种不同性质的属性集工具，并给出其相关定理及证明；同时开发一种约简信息函数，从而为约简属性赋值；然后，将确定性因子作为启发信息，并采用自底向上式分层搜索策略来构建启发式属性值约简模型，并以程序伪代码的形式直观展示模型的布置路径与运行流程；最后，采用已有研究中的模拟数据开展模型的应用与验证，并对模型的优势、适用性与延展性展开总结与讨论。结果表明，新模型可行有效，易于编程实现；对数据特征要求低，适合一般性专家系统；所提取的价值信息多元简约，泛化性强，不丢失决策系统的关键信息。

基于伪标签一致度的不平衡数据特征选择算法

李懿恒, 杜晨曦, 杨燕燕, 李翔宇

2022, 42(2): 475-484. DOI: 10.11772/j.issn.1001-9081.2021050957

摘要 ( )

HTML ( )

PDF (921KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对大多数粒计算特征选择算法未考虑数据的类别不平衡性的问题，提出一种融合伪标签策略的类别不平衡数据特征选择算法。首先，为了便于研究类别不平衡数据特征选择算法，重新定义样本和数据集一致度的概念，并设计了相应特征选择的贪婪前向搜索算法；其次，引入伪标签策略以平衡数据的类别分布，并将所学样本的伪标签融入一致性测度中，以构造伪标签一致度来估计类别不平衡数据集的特征；最后，通过保持类别不平衡数据集的伪标签一致度不变，设计一种面向类别不平衡数据的基于伪标签一致性的特征选择算法（PLCFS）。实验结果表明，所提PLCFS的性能仅次于最大相关最小冗余（mRMR）算法，而优于Relief算法和基于一致性的特征选择算法（CFS）。

基于邻域熵的高光谱波段选择算法

翟东昌, 陈红梅

2022, 42(2): 485-492. DOI: 10.11772/j.issn.1001-9081.2021020332

摘要 ( )

HTML ( )

PDF (1092KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为了减少高光谱图像数据中的冗余信息，优化计算效率，并提升图像数据后续应用的有效性，提出一种基于邻域熵（NE）的高光谱波段选择算法。首先，为了高效计算样本的邻域子集，采用了局部敏感哈希（LSH）作为近似最近邻的搜索策略；然后，引入了NE理论来度量波段和类之间的互信息（MI），并把最小化特征集合与类变量之间的条件熵作为选取有效波段的方法；最后，采用两个数据集，通过支持向量机（SVM）和随机森林（RM）进行分类实验。实验结果表明，相较于四种基于MI的特征选择算法，从总体精度以及Kappa系数上看，所提算法能够在30个波段内较快地选取有效波段子集，并达到局部最优。该算法的部分实验结果的总体精度以及Kappa系数分别达到全局最优的92.99%以及0.860 8，表明所提算法能有效地处理高光谱波段选择问题。

面向航空自组网的节点失效波及影响分析模型

谢丽霞, 严莉萍, 杨宏宇

2022, 42(2): 493-501. DOI: 10.11772/j.issn.1001-9081.2021020348

摘要 ( )

HTML ( )

PDF (1030KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为有效分析航空自组网（AANET）中节点失效对整个网络造成的影响，并提高网络在发生安全事件之后的稳定性，提出一种面向AANET的节点失效波及影响分析模型。首先，根据AANET的主要业务建立有向加权业务网络，基于实时AANET建立以各类航空器为节点的无向加权物理网络，并通过业务-物理网络映射关系建立相依网络模型；其次，提出面向AANET的失效传播模型，分析网络节点状态及其之间的相互转换方式；最后，基于链路生存性改进失效流量再分配算法，并将其应用于构建的相依网络模型上，得到因节点失效波及反应转化成失效节点和业务降级节点的集合，并将其用于分析网络各时刻的波及影响情况。实验结果表明，所提出的模型能更准确反映AANET节点失效波及影响情况。

考虑过载状态和失效概率的航空网络级联故障模型

樊成, 王布宏, 田继伟

2022, 42(2): 502-509. DOI: 10.11772/j.issn.1001-9081.2021020319

摘要 ( )

HTML ( )

PDF (873KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为提高突然事件引起的级联故障对航空网络破坏程度的评估可信性，考虑到机场节点对负载的冗余能力，即如果在一定的空间范围内出现过载，节点不会立即失效，而是具备一定的超额负载处置能力，提出一种考虑过载状态和失效概率的航空网络级联故障模型。该模型首先在传统的“负载-容量”Motter-Lai级联故障模型中增加了过载系数、权重系数、分布系数和容量系数，其次以过载状态和失效概率来描述网络节点的冗余容量特性，并对失效节点和过载节点采用不同的负载重分配策略，使模型更贴合航空网络实际。理论分析和仿真结果表明：在一定范围内提升过载系数有助于降低级联故障的影响，然而提升到一定程度后改善效果不明显；模型中的各参数存在最优区间，可以使航空网络保持较好鲁棒性的同时，花费较小的构建成本，据此对航空网络资源进行优化配置，可以提升网络对级联故障的抵御能力。

面向深度学习可解释性的对抗攻击算法

陈权, 李莉, 陈永乐, 段跃兴

2022, 42(2): 510-518. DOI: 10.11772/j.issn.1001-9081.2021020360

摘要 ( )

HTML ( )

PDF (1283KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对深度神经网络（DNN）中的可解释性导致模型信息泄露的问题，证明了在白盒环境下利用Grad-CAM解释方法产生对抗样本的可行性，并提出一种无目标的黑盒攻击算法——动态遗传算法。该算法首先根据解释区域与扰动像素位置的变化关系改进适应度函数，然后通过多轮的遗传算法在不断减少扰动值的同时递增扰动像素的数量，而且每一轮的结果坐标集会在下一轮的迭代中保留使用，直到在未超过扰动边界的情况下扰动像素集合使预测标签发生翻转。在实验部分，所提算法在AlexNet、VGG-19、ResNet-50和SqueezeNet模型下的攻击成功率平均为92.88%，与One pixel算法相比，虽然增加了8%的运行时间，但成功率提高了16.53个百分点。此外，该算法能够在更短的运行时间内，使成功率高于Ada-FGSM算法3.18个百分点，高于PPBA算法8.63个百分点，并且与Boundary-attack算法的成功率相差不大。结果表明基于解释方法的动态遗传算法能有效进行对抗攻击。

基于星火区块链的跨链机制

谢家贵, 李志平, 金键

2022, 42(2): 519-527. DOI: 10.11772/j.issn.1001-9081.2021020353

摘要 ( )

HTML ( )

PDF (888KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对当前区块链技术飞速发展的过程中，不同区块链之间相对孤立，数据不能交互共享的问题，提出一种基于星火区块链的跨链机制。首先，对常见跨链技术和当前主流跨链项目作了分析，研究了不同技术和项目的实现原理，并总结了它们的区别和优缺点；然后，利用主子链模式的区块链架构，设计了智能合约组件、交易校验组件、交易超时组件等关键核心组件，并详细阐述了跨链过程的交易发起、交易路由、交易核验、交易确认这四个阶段；最后，设计了可行的实验进行性能测试和安全性测试，并对安全性进行了分析。实验结果表明，星火区块链在交易延迟、吞吐量和尖峰冲击测试等方面相比其他区块链有较显著的优势；另外在恶意节点的比例较低时，跨链交易的成功率为100%，不同子链间可以安全稳定地进行跨链交易。该机制解决了区块链之间数据交互共享的问题，能为下一步星火区块链应用场景的设计提供技术参考。

基于OpenFlow的软件定义网络流规则冲突检测系统

张立群, 林海涛, 郇文明, 毕文婷

2022, 42(2): 528-533. DOI: 10.11772/j.issn.1001-9081.2021020362

摘要 ( )

HTML ( )

PDF (676KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在软件定义网络（SDN）中，各类网络应用的独立开发以及多用户的网络管理可能导致下发至交换设备的流规则发生冲突，而控制平面与转发平面的分离使得交换设备缺乏策略分析能力，无法独立检测内部的流规则冲突。针对这一问题，提出一种流规则冲突检测系统和检测算法。首先，通过监听、捕获控制平面与转发平面之间的OpenFlow报文，获取即将下发的流规则的信息。然后，使用冲突检测算法判定流规则的冲突类型。该算法根据流规则的匹配协议选择对应的规则集合，从而缩小了检测规模；而且在检测时优先对无冲突（NC）规则的特征进行检测，使得对NC规则的检测效率要高于其他类型的冲突规则。最后，根据冲突类型对流规则进行冲突消解。实验结果表明，所提冲突检测算法的检测准确率可以达到100%，与动态冲突检测模型相比该算法在同等规模的规则集合下的检测时间缩短约47%。且检测时间随NC规则占比的提高而缩短。

求解工程约束问题的新型智能优化算法及展望

张孟健, 王德光, 汪敏, 杨靖

2022, 42(2): 534-541. DOI: 10.11772/j.issn.1001-9081.2021020265

摘要 ( )

HTML ( )

PDF (849KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为了研究新型智能优化算法的性能和应用前景，选择了近几年提出的6种仿生智能优化算法：哈里斯鹰优化（HHO）算法、平衡优化（EO）算法、海洋捕食者算法（MPA）、政治优化（PO）算法、黏液霉菌算法（SMA）和堆阵优化（HBO）算法，对其性能和在不同带约束的工程优化问题上的应用进行对比分析。首先，对6种优化算法的基本原理进行介绍；然后，用6种优化算法对10个基准测试函数进行寻优测试；接着，将6种优化算法用于求解3种带约束的工程优化问题。实验结果表明，对于单峰和多峰测试函数的寻优，PO的收敛精度最佳，能够多次达到理论最优值0，且收敛速度较快；对于求解工程约束问题，EO和MPA较好，因为的标准差的数量级较小，且寻优速度较快，稳定性高。最后，分析了6种优化算法的改进方法及其发展潜力。

基于参考向量的自适应约束多目标进化算法

史非凡, 史旭华

2022, 42(2): 542-549. DOI: 10.11772/j.issn.1001-9081.2021020337

摘要 ( )

HTML ( )

PDF (1068KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对目前用多目标进化算法（MOEA）处理约束多目标优化问题（CMOP）的研究通常以解决单一类型约束为主，而在面对不同种类的复杂约束时算法难以收敛或者种群分布性差的问题，以基于分解的多目标进化算法（MOEA/D）框架为基础，提出一种基于参考向量的自适应约束多目标进化算法（ARVCMOEA）。首先将参考向量分成主参考向量及辅助参考向量两部分，然后在算法起始阶段通过无约束的辅助参考向量指导种群快速跨越不可行区间，最后通过自适应地调整辅助参考向量的位置及弱化对其的分布性要求来提高算法分布性及搜索能力。实验在30个具有不同种类复杂约束的测试函数上进行了验证，结果表明所提算法面对不同种类的约束时均可以很好地收敛，在总体性能上均优于NSGA-II（Non-dominated Sorting Genetic Algorithm II）、C-MOEA/D（Constraint-MOEA/D）及MOEA/D-DAE，并且相较于目前性能优异的CCMO（Coevolutionary Constrained Multi-objective Optimization framework）在部分测试函数上可以得到更优异的结果。可见，所提算法在面对不同种类的CMOP时具有优异的性能。

基于时变资源的容器化虚拟网络映射算法

邓伟健, 陈曦

2022, 42(2): 550-556. DOI: 10.11772/j.issn.1001-9081.2021020297

摘要 ( )

HTML ( )

PDF (1084KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为了构建大规模容器化虚拟网络，达到搭建高保真、易编程的虚拟网络环境的目的，提出一种基于时变资源的容器化虚拟网络映射算法，将OVS和Docker容器化的虚拟网络切块，并分布式地映射到若干计算、网络、存储资源受限的物理宿主机。首先，根据虚拟网络的拓扑结构，将具有密切链路关系的虚拟网元进行层次化聚合，以减小问题规模；其次，对聚合后的虚拟网络节点进行重要性评分，采用广度优先搜索算法与贪心策略对虚拟网络切块，并映射到资源匹配的物理宿主机；最后，通过虚拟网元消耗资源的定时反馈对算法中的资源评价模型作运行时动态调整，从而使物理资源得到有效利用。实验结果表明，该算法可在多台低配X86宿主机上容纳超过1 300网元的虚拟网络，且把网络抖动维持在0.1 ms以下。

基于E-CARGO模型的开发者推荐方法

李炜, 吴群群, 张以文

2022, 42(2): 557-564. DOI: 10.11772/j.issn.1001-9081.2021020273

摘要 ( )

HTML ( )

PDF (649KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统开发者推荐方法侧重于分析开发者的专业能力以及与任务的交互信息，而未考虑开发者间协作性的问题，提出一种基于E-CARGO（Environment-Class， Agent， Role， Group， and Object）模型的开发者推荐方法。首先结合协作开发的特点，将开发者协同开发过程描述为基于角色的协作，并使用E-CARGO模型对其进行建模；然后使用模糊层次分析（FAHP）法来建立模糊判断矩阵，从而求得开发者能力指标权重并进行加权求和，进而得到开发者历史综合能力评价集合；最后针对开发者综合能力评价的不确定和动态特性，利用云模型理论对开发者历史综合能力评价集合进行分析，以求得开发者对于每个任务的胜任能力，并利用cplex优化包对开发者推荐问题进行求解。实验结果表明，所提方法能够在可接受的时间范围内求得最优的开发者推荐结果，验证了所提方法的有效性。

循环程序的界函数合成

谭旺, 李轶

2022, 42(2): 565-573. DOI: 10.11772/j.issn.1001-9081.2021020221

摘要 ( )

HTML ( )

PDF (596KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

作为循环程序终止性分析的主流方法，当前的秩函数方法大多局限于线性或多项式秩函数的求解。针对循环程序若不存在对应的线性或多项式秩函数，现有秩函数方法就无法证明其终止性的问题，提出一个新的方法来合成给定循环程序对应的界函数。对于给定的循环程序，倘若能找到其界函数，则表明该循环程序是可终止的。首先将界函数的求解问题转化为一个线性二分类问题，并在选定界函数模板后，根据模板建立映射关系以构建训练集；然后利用所得训练集通过支持向量机（SVM）获取分类超平面进而求解得到模板系数，从而得到候选的界函数；最后利用现有的符号验证工具Redlog对该候选界函数进行验证。实验结果表明，相较于现有的秩函数方法，所提方法不仅能够应用于更多的循环程序，而且所得界函数在形式上相较于秩函数更加简化。具体表现为，对于某些没有线性秩函数的循环，该方法可以得到其对应的线性界函数；同时，对于某些只有多阶段线性秩函数的循环，该方法可以求解得到全局的线性界函数。

基于分数阶网络和强化学习的图像实例分割模型

李学明, 吴国豪, 周尚波, 林晓然, 谢洪斌

2022, 42(2): 574-583. DOI: 10.11772/j.issn.1001-9081.2021020324

摘要 ( )

HTML ( )

PDF (2853KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对目前的分数阶非线性模型图像特征提取能力不足导致分割精度较低的问题，提出一种基于分数阶网络和强化学习（RL）的图像实例分割模型，用来分割出图像中目标实例的高质量轮廓曲线。该模型共包含两层模块：1）第一层为二维分数阶非线性网络，主要采用混沌同步方法来获取图像中像素点的基础特征，并通过根据像素点间的相似性进行耦合连接的方式获取初步的图像分割结果；2）第二层通过RL思想将图像实例分割建立为一个马尔可夫决策过程（MDP），并利用建模过程中的动作-状态对、奖励函数和策略的设计来获取图像的区域结构和类别信息。最后将第一层获取到的像素特征和初步的图像分割结果与第二层获取到的区域结构和类别信息联合起来进行实例分割。在Pascal VOC2007 和Pascal VOC2012数据集上的实验结果表明，这种基于连续决策的图像实例分割模型与传统的分数阶模型相比，平均精度（AP）至少提升了15个百分点，不仅能够获取图像中目标物体的类别信息，而且进一步提升了对图像轮廓细节和细粒度信息的提取能力。

基于超分辨率网络的CT三维重建算法

李俊伯, 秦品乐, 曾建潮, 李萌

2022, 42(2): 584-591. DOI: 10.11772/j.issn.1001-9081.2021020219

摘要 ( )

HTML ( )

PDF (1088KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

计算机断层扫描（CT）三维重建技术通过上采样体数据来提高三维模型质量，减轻模型中的锯齿状边缘、条纹状伪影和不连续表面等现象，从而提高临床医学中疾病诊断的准确率。针对以往CT三维重建后模型仍然不够清晰的问题，提出一种基于超分辨率网络的CT三维重建算法。网络模型为具有双重损失的优化学习纵轴超分辨率重建网络（DLRNet），通过单轴超分辨率进行腹部CT三维重建。网络末端引入优化学习模块，且除计算基准图与超分辨率图像的损失外，还计算网络内部粗略重建图像与基准图的损失，这样一来，优化学习与双重损失能使网络产生更接近于基准图的结果。随后在特征提取模块引入空间特征金字塔池化和通道注意力机制，加权细化学习了不同粗细以及规模不一的血管组织的特征。最后使用动态生成卷积核组的方法进行上采样使得单一网络模型可应对不同缩放因子的上采样任务。实验结果表明，相较于通道注意力的方法RCAN（Residual Channel Attention Network），所提网络模型在2、3、4倍缩放因子下的峰值信噪比（PSNR）平均提高0.789 dB。可见所提网络模型有效提升了CT三维模型的质量，一定程度上恢复了血管组织的连续细节特征，同时具备了实用性。

基于教与学优化的可变卷积自编码器的医学图像分类方法

李薇, 樊瑶驰, 江巧永, 王磊, 徐庆征

2022, 42(2): 592-598. DOI: 10.11772/j.issn.1001-9081.2021061109

摘要 ( )

HTML ( )

PDF (634KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统手工方法优化卷积神经网络（CNN）参数时存在耗时长、不准确，以及参数设置影响算法性能等问题，提出一种基于教与学优化（TLBO）的可变卷积自编码器（CAE）算法。该算法设计了可变长度的个体编码策略，从而快速构建CAE结构，并堆叠CAE为一个CNN；此外，充分利用优秀个体的结构信息来引导算法朝着更有希望的区域搜索，从而提高算法性能。实验结果表明，所提算法在解决医学图像分类问题时，分类精度达到89.84%，高于传统CNN和同类型神经网络。该算法通过优化CAE结构和堆叠CNN解决医学图像分类问题，有效提高了医学图像分类性能。

基于遗传算法和粒子群优化的列车自动驾驶速度曲线优化方法

张京, 朱爱红

2022, 42(2): 599-605. DOI: 10.11772/j.issn.1001-9081.2021020292

摘要 ( )

HTML ( )

PDF (746KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对列车自动驾驶（ATO）过程中的精准停车、准时性、舒适性以及能耗问题，提出一种基于遗传算法与粒子群优化（GAPSO）算法结合的ATO速度曲线优化方法。首先，建立列车ATO运行多目标优化模型，将列车过分相区断电惰行纳入控制策略，并对运行控制策略进行分析；其次，对粒子群优化（PSO）算法进行改进，采用非线性动态惯性权重和改进的加速度系数，并将遗传算子融入其中，从而构成一种全新的GAPSO算法，且验证了GAPSO算法在全局搜索和局部搜索能力以及收敛速度上的优越性。最后，通过GAPSO算法对工况转换点进行寻优，以获取一组满足多目标优化的工况转换点速度，进而得到最优目标速度曲线。仿真实验结果表明，所提优化方法在总体运行时间满足准时性要求的前提下，使能耗降低了13.29%，舒适性提高了26.62%，停车误差降低了21.62%。由此可见，优化后的列车目标速度曲线能够满足多目标要求，该方法为列车ATO多目标优化提供了一种可行的解决方案。

基于混合模拟退火算法的机场进场程序优化

陈昇, 周隽, 胡小兵, 马霁

2022, 42(2): 606-615. DOI: 10.11772/j.issn.1001-9081.2021040586

摘要 ( )

HTML ( )

PDF (1426KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对人工设计机场进场程序耗时较长且很难定量优化路径长度的问题，提出多条进场程序的三维自动优化设计方法。首先，根据区域导航规范（RNAV）对进场程序的几何构型及汇聚结构进行建模；然后，综合考虑机场布局以及障碍物规避、航路间隔等航空器运行约束，以最小化进场程序总长度为目标，建立了完整的数学模型；最后，开发了基于模拟退火算法和改进A^*算法的混合算法，以对进场程序的汇聚结构进行自动优化设计。仿真结果表明，在基于瑞典阿兰达（Arlanda）机场的实验中，与现有相关的整数规划方法相比，混合模拟退火算法规划出的路径长度缩短了3%，且计算耗时减少了87%；在基于上海浦东机场的实验中，与实际进场程序相比，所提算法规划出的路径长度缩短了6.6%。从这些结果可以看出，该算法能够有效设计多条三维进场程序，可以为程序设计人员提供初步决策支持。

基于三支决策的飞机空战机动决策方法

越凯强, 李波, 范盘龙

2022, 42(2): 616-621. DOI: 10.11772/j.issn.1001-9081.2021050855

摘要 ( )

HTML ( )

PDF (1931KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为了提高战斗机在信息不充足条件下的机动决策能力，提出一种基于三支决策的飞机空战机动决策方法。首先，使用三支决策意图识别模型对目标意图进行识别；其次，将目标的作战意图因素引入到威胁评估中后，结合目标的威胁程度，提出基于三支决策的机动决策权重因子动态调整法；最后，使用模糊逻辑构建机动决策因子评价函数，并利用权值动态调整策略和机动决策评价函数求出每一阶段飞机最佳的机动方式，从而形成可行有效的飞行路线。仿真实验结果表明，所设计的基于三支决策的飞机空战机动决策方法具有可行性和有效性。

基于关节点特征的跌倒检测算法

曹建荣, 朱亚琴, 张玉婷, 吕俊杰, 杨红娟

2022, 42(2): 622-630. DOI: 10.11772/j.issn.1001-9081.2021040618

摘要 ( )

HTML ( )

PDF (1203KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对跌倒检测算法中存在网络计算量大和类跌倒行为难以区分的问题，提出一种基于关节点特征的跌倒检测算法。首先，在目前先进的CenterNet算法基础上提出了深度可分离卷积CenterNet （DSC-CenterNet）关节点检测算法，从而在减少骨干网络计算量的同时准确检测人体关节点并获取关节点坐标；然后，基于关节点位置和人体先验知识来提取可充分表达跌倒行为的空间特征和时间特征作为关节点特征；最后，把关节点特征向量输入全连接层，并经Sigmoid分类器输出跌倒或非跌倒两种类别，从而实现人体目标的跌倒检测。实验结果表明，所提算法在UR Fall Detection数据集上对不同状态变化下跌倒检测的平均准确率达到98.00%，区分类跌倒行为的准确率达到98.22%，跌倒检测速度为18.6 frame/s。与原CenterNet结合关节点特征跌倒检测的算法相比，DSC-CenterNet结合关节点特征算法的跌倒检测速度提升了22.37%，提高后的速度可有效满足视频监控下人体跌倒检测任务的实时性。该算法能有效提高跌倒检测速度并对人体跌倒状态进行准确检测，且进一步验证了基于关节点特征的跌倒检测算法在视频跌倒行为分析中的可行性与高效性。

基于改进Faster-RCNN的绝缘子检测算法

马耀名, 张雨

2022, 42(2): 631-637. DOI: 10.11772/j.issn.1001-9081.2021020342

摘要 ( )

HTML ( )

PDF (1867KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为了提高高压输电线路巡检效率，提出改进Faster-RCNN的绝缘子检测算法。首先，在特征提取网络中添加具有注意力机制动态选择机制网络（SKNet），从而使网络着重学习与绝缘子特征相关通道；其次，借助滤波器响应归一化（FRN）层替代原批归一化（BN）层，以避免模型陷入梯度饱和区域；最后，使用距离交并比（DIoU）代替原交并比（IoU）方法，以精确表达特征候选区域框位置。对开源航拍绝缘子数据集进行平移、旋转、Cutout和CutMix等操作来进行增强，将数据集扩充到3 000张并从中随机选择2 500张作为训练集，其余500张作为测试集。相较于原Faster-RCNN算法，所提算法平均准确率提高了3.46个百分点，平均召回率提高了2.76个百分点。实验结果表明：所提算法具有较高检测精度和稳定性，可满足电力巡线绝缘子检测应用场景需求。

基于可变形卷积和自适应空间特征融合的硬币表面缺陷检测算法

王品学, 张绍兵, 成苗, 何莲, 秦小山

2022, 42(2): 638-645. DOI: 10.11772/j.issn.1001-9081.2021020227

摘要 ( )

HTML ( )

PDF (6462KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对硬币表面缺陷较小、形状多变且易与背景混淆而不易检出的问题，改进YOLOv3算法并提出基于可变形卷积和自适应空间特征融合的硬币表面缺陷检测算法DCA-YOLO。首先，由于缺陷形状的多变设计了3种在主干网络中不同位置添加可变形卷积模块的网络结构，通过卷积学习偏移量和调节参数来提高缺陷的提取能力；然后，使用自适应空间特征融合网络学习权重参数来调整不同尺度特征图中各像素点的贡献度以更好地适应不同尺度的目标；最后，改进先验锚框比例，动态调节类别权重，优化并对比网络性能，从而提出在主干网络输出特征进行多尺度融合的上采样前增加可变形卷积的模型网络。实验结果表明，在硬币缺陷数据集上，DCA-YOLO算法检测平均精度均值（mAP）接近于Faster-RCNN，达到了92.8%；而相较于YOLOv3，所提算法的检测速度基本持平，在检测mAP上提高了3.3个百分点，F1分数提升了3.2个百分点。

页岩气储层预测的多标签主动学习算法

汪敏, 冯婷婷, 闵帆, 唐洪明, 闫建平, 廖纪佳

2022, 42(2): 646-654. DOI: 10.11772/j.issn.1001-9081.2021041023

摘要 ( )

HTML ( )

PDF (540KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对页岩气储层数据获取困难、标签稀缺、标注成本高昂的问题，提出一种多标准主动查询的多标签学习（MAML）算法。首先，考虑样本的信息性和代表性来对样本进行初步处理；其次，加入包括属性差异性和标签丰富性的样本丰富性约束，在此基础上选择有价值的样本进行标签查询；最后，利用多标签学习算法来预测剩余样本的标签。通过11个Yahoo数据集上的实验，将MAML算法与流行的多标签学习算法和主动学习算法进行比较，验证了MAML算法的优越性。然后将实验扩展到4个真实的页岩气测井数据集。在该实验中，与多标签学习算法：基于K最近邻的多标签（ML-KNN）学习方法、多标签学习的反向传播（BP-MLL）算法、具有全局和局部标签相关性的多标签学习方法（GLOCAL）和通过查询信息性和代表性样本的主动学习（QUIRE）方法相比，MAML算法在页岩气储层综合品质预测精度均值上分别提升了45个百分点、68个百分点、68个百分点和51个百分点。实验结果充分验证了MAML算法在页岩气储层甜点预测领域的实用性和优越性。

基于聚类和局部线性回归的初至波自动拾取算法

高磊, 罗关凤, 刘荡, 闵帆

2022, 42(2): 655-662. DOI: 10.11772/j.issn.1001-9081.2021041046

摘要 ( )

HTML ( )

PDF (4785KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

初至波拾取是地震数据处理中的关键步骤，会直接影响动校正、静校正和速度分析等的精度。目前，现有的算法受到背景噪声和复杂近地表条件的影响时拾取精度会降低。基于此，提出基于聚类和局部线性回归的初至波自动拾取算法（FPCL）。该算法由预拾取和微调两个阶段来实现。预拾取阶段先基于k均值（k-means）技术找到初至波簇，再利用基于密度的噪声应用空间聚类（DBSCAN）技术在初至波簇中进行拾取。微调阶段通过局部线性回归补齐缺失值，再利用能量比值最小化技术调整错误值。在两个地震数据集上，将FPCL与改进的能量比（IMER）法相比，准确率分别提升了4.00个百分点和3.50个百分点；与互相关技术（CCT）相比，准确率分别提升了38.00个百分点和10.25个百分点；与基于模糊C均值聚类的微震数据自动时间拾取算法（APF）相比，准确率分别提升了34.50个百分点和3.50个百分点；与基于两阶段优化的初至波自动拾取算法（FPTO）相比，准确率分别提升了5.50个百分点和16.25个百分点。上述实验结果表明FPCL更准确。

当期目录