当期目录

    2021年 第41卷 第12期 刊出日期:2021-12-10
    第十八届中国机器学习会议(CCML 2021)
    解耦表征学习研究进展
    成科扬, 孟春运, 王文杉, 师文喜, 詹永照
    2021, 41(12):  3409-3418.  DOI: 10.11772/j.issn.1001-9081.2021060895
    摘要 ( )   HTML ( )   PDF (877KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    解耦表征学习旨在对影响数据形态的关键因素进行建模,使得某一关键因素的变化仅仅引起数据在某项特征上的变化,而其他的特征不受影响,这有利于应对机器学习在模型可解释性、对象生成和操作以及零样本学习等问题上的挑战,因此解耦表征学习一直是机器学习领域的一个研究热点。从解耦表征学习的历史与动机入手,对解耦表征学习的研究现状以及应用进行归纳总结,分析了解耦表征所具有的不变性、复用性等特性,介绍了基于生成解耦表征变差因素的研究、基于流形相互作用解耦表征变差因素的研究、基于对抗性训练解耦表征变差因素的研究,以及一种变分自编码器β-VAE的研究等最新研究动态。同时,阐述了解耦表征学习的典型应用,并对未来的研究方向作出了展望。

    基于空间收缩技术的约束多目标进化算法
    李二超, 毛玉燕
    2021, 41(12):  3419-3425.  DOI: 10.11772/j.issn.1001-9081.2021060887
    摘要 ( )   HTML ( )   PDF (979KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    约束多目标进化算法在求解不可行域较大的优化问题时对不可行域的合理探索不仅有助于种群快速收敛于可行区域内的最优解,还能减少无潜力不可行域对算法性能的影响。因此,提出一种基于空间收缩技术的约束多目标进化算法(CMOEA-SST)。首先,提出自适应精英保留策略对PPS算法的Pull阶段初始种群进行改进,增加Pull阶段初始种群的多样性和可行性;其次,在进化过程中采用空间收缩技术逐渐缩小搜索空间,减少无潜力不可行域对算法性能的影响,使算法在兼顾收敛性和多样性的同时提高收敛精度。为验证所提算法性能,将该算法与四个代表性算法C-MOEA/D、ToP、C-TAEA、PPS在LIRCMOP系列测试问题上进行仿真对比。实验结果表明,CMOEA-SST在处理不可行域较大约束优化问题时具有更好的收敛性和多样性。

    基于知识蒸馏的特定知识学习
    戴朝霞, 曹堉栋, 朱光明, 沈沛意, 徐旭, 梅林, 张亮
    2021, 41(12):  3426-3431.  DOI: 10.11772/j.issn.1001-9081.2021060923
    摘要 ( )   HTML ( )   PDF (648KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在传统知识蒸馏框架中,教师网络将自身的知识全盘传递给学生网络,而传递部分知识或者特定知识的研究几乎没有。考虑到工业现场具有场景单一、分类数目少的特点,需要重点评估神经网络模型在特定类别领域的识别性能。基于注意力特征迁移蒸馏算法,提出了三种特定知识学习算法来提升学生网络在特定类别分类中的分类性能。首先,对训练数据集作特定类筛选以排除其他非特定类别的训练数据;在此基础上,将其他非特定类别视为背景并在蒸馏过程中抑制背景知识,从而进一步减少其他无关类知识对特定类知识的影响;最后,更改网络结构,即仅在网络高层抑制背景类知识,而保留网络底层基础图形特征的学习。实验结果表明,通过特定知识学习算法训练的学生网络在特定类别分类中能够媲美甚至超越参数规模六倍于它的教师网络的分类性能。

    基于深度神经网络和门控循环单元的动态图表示学习方法
    李慧博, 赵云霄, 白亮
    2021, 41(12):  3432-3437.  DOI: 10.11772/j.issn.1001-9081.2021060994
    摘要 ( )   HTML ( )   PDF (869KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    学习图中节点的潜在向量表示是一项重要且普遍存在的任务,旨在捕捉图中节点的各种属性。大量工作证明静态图表示已经能够学习到节点的部分信息,然而,真实世界的图是随着时间的推移而演变的。为了解决多数动态网络算法不能有效保留节点邻域结构和时态信息的问题,提出了基于深度神经网络(DNN)和门控循环单元(GRU)的动态网络表示学习方法DynAEGRU。该方法以自编码器作为框架,其中的编码器首先用DNN聚集邻域信息以得到低维特征向量,然后使用GRU网络提取节点时态信息,最后用解码器重构邻接矩阵并将其与真实图对比来构建损失。通过与几种静态图和动态图表示学习算法在3个数据集上进行实验分析,结果表明DynAEGRU具有较好的性能增益。

    基于一致图学习的鲁棒多视图子空间聚类
    潘振君, 梁成, 张化祥
    2021, 41(12):  3438-3446.  DOI: 10.11772/j.issn.1001-9081.2021061056
    摘要 ( )   HTML ( )   PDF (781KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对多视图数据分析易受原始数据集噪声干扰,以及需要额外的步骤计算聚类结果的问题,提出一种基于一致图学习的鲁棒多视图子空间聚类(RMCGL)算法。首先,在各个视图下学习数据在子空间中的潜在鲁棒表示,并基于该表示得到各视图的相似度矩阵。随后,基于得到的多个相似度矩阵学习一个统一的相似度图。最后,通过对相似度图对应的拉普拉斯矩阵添加秩约束,确保得到的相似度图具有最优的聚类结构,并可直接得到最终的聚类结果。该过程在一个统一的优化框架中完成,能同时学习潜在鲁棒表示、相似度矩阵和一致图。RMCGL算法的聚类精度(ACC)在BBC、100leaves和MSRC数据集上比基于图的多视图聚类(GMC)算法分别提升了3.36个百分点、5.82个百分点和5.71个百分点。实验结果表明,该算法具有良好的聚类效果。

    基于核非负矩阵分解的有向图聚类算法
    陈献, 胡丽莹, 林晓炜, 陈黎飞
    2021, 41(12):  3447-3454.  DOI: 10.11772/j.issn.1001-9081.2021061129
    摘要 ( )   HTML ( )   PDF (653KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的有向图聚类算法大多基于向量空间中节点间的近似线性关系假设,忽略了节点间存在的非线性相关性。针对该问题,提出一种基于核非负矩阵分解(KNMF)的有向图聚类算法。首先,引入核学习方法将有向图的邻接矩阵投影到核空间,并通过特定的正则项约束原空间及核空间中节点间的相似性。其次,提出了图正则化核非对称NMF算法的目标函数,并在非负约束条件下通过梯度下降方法推导出一个聚类算法。该算法在考虑节点连边的方向性的同时利用核学习方法建模节点间的非线性关系,从而准确地揭示有向图中潜在的结构信息。最后,在专利-引文网络(PCN)数据集上的实验结果表明,簇的数目为2时,和对比算法相比,所提算法将DB值和DQF值分别提高了约0.25和8%,取得了更好的聚类质量。

    基于图学习正则判别非负矩阵分解的人脸识别
    杜汉, 龙显忠, 李云
    2021, 41(12):  3455-3461.  DOI: 10.11772/j.issn.1001-9081.2021060979
    摘要 ( )   HTML ( )   PDF (790KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于图正则非负矩阵分解(NMF)算法充分利用了高维数据通常位于一个低维流形空间的假设从而构造拉普拉斯矩阵,但该算法的缺点是构造出的拉普拉斯矩阵是提前计算得到的,并没有在乘性更新过程中对它进行迭代。为了解决这个问题,结合子空间学习中的自表示方法生成表示系数,并进一步计算相似性矩阵从而得到拉普拉斯矩阵,而且在更新过程中对拉普拉斯矩阵进行迭代。另外,利用训练集的标签信息构造类别指示矩阵,并引入两个不同的正则项分别对该类别指示矩阵进行重构。该算法被称为图学习正则判别非负矩阵分解(GLDNMF),并给出了相应的乘性更新规则和目标函数的收敛性证明。在两个标准数据集上的人脸识别实验结果显示,和现有典型算法相比,所提算法的人脸识别的准确率提升了1% ~ 5%,验证了其有效性。

    基于神经正切核的多核学习方法
    王梅, 许传海, 刘勇
    2021, 41(12):  3462-3467.  DOI: 10.11772/j.issn.1001-9081.2021060998
    摘要 ( )   HTML ( )   PDF (510KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    多核学习方法是一类重要的核学习方法,但大多数多核学习方法存在如下问题:多核学习方法中的基核函数大多选择传统的具有浅层结构的核函数,在处理数据规模大且分布不平坦的问题时表示能力较弱;现有的多核学习方法的泛化误差收敛率大多为O1/n,收敛速度较慢。为此,提出了一种基于神经正切核(NTK)的多核学习方法。首先,将具有深层次结构的NTK作为多核学习方法的基核函数,从而增强多核学习方法的表示能力。然后,根据主特征值比例度量证明了一种收敛速率可达O1/n的泛化误差界;在此基础上,结合核对齐度量设计了一种全新的多核学习算法。最后,在多个数据集上进行了实验,实验结果表明,相比Adaboost和K近邻(KNN)等分类算法,新提出的多核学习算法具有更高的准确率和更好的表示能力,也验证了所提方法的可行性与有效性。

    基于上界单纯形投影图张量学习的多核聚类算法
    雷皓云, 任珍文, 汪彦龙, 薛爽, 李浩然
    2021, 41(12):  3468-3474.  DOI: 10.11772/j.issn.1001-9081.2021061393
    摘要 ( )   HTML ( )   PDF (6316KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    近年来,多核图聚类(MKGC)受到了广泛的关注,这得益于多核学习能有效地避免核函数与核参数的选择,而图聚类能充分挖掘样本间的复杂结构信息。然而现有的MKGC方法存在着如下问题:图学习技术使得模型复杂化,图拉普拉斯矩阵的高秩特性使其难以保证学到的关系图包含精确的c个连通分量(块对角性质),以及大部分方法忽略了候选关系图间的高阶结构信息,使得多核信息难以被充分利用。针对以上问题,提出了一种新的MKGC方法。首先,提出一种新的上界单纯形投影图学习方法,直接将核矩阵投影到图单纯形上,降低了计算复杂度;同时,引入一种新的块对角约束,使学到的关系图能保持精确的块对角属性;此外,在上界单纯形投影空间中引入低秩张量学习来充分挖掘多个候选关系图的高阶结构信息。在多个数据集上与现有的MKGC方法相比,所提出方法计算量小、稳定性高,在聚类精度(ACC)和标准互信息(NMI)指标上具有较大的优势。

    基于频繁项挖掘的贝叶斯网络结构学习算法BNSL-FIM
    李昡熠, 周鋆
    2021, 41(12):  3475-3479.  DOI: 10.11772/j.issn.1001-9081.2021060898
    摘要 ( )   HTML ( )   PDF (542KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    贝叶斯网络能够表示不确定知识并进行推理计算表达,但由于实际样本数据存在噪声和大小限制以及网络空间搜索的复杂性,贝叶斯网络结构学习始终会存在一定的误差。为了提高贝叶斯网络结构学习的准确度,提出了以最大频繁项集和关联规则分析结果为先验知识的贝叶斯网络结构学习算法BNSL-FIM 。首先从数据中挖掘出最大频繁项集并对该项集进行结构学习,之后使用关联规则分析结果对其进行校正,从而确定基于频繁项挖掘和关联规则分析的先验知识。然后提出一种融合先验知识的BDeu评分算法进行贝叶斯网络结构学习。最后在6个公开标准的数据集上开展了实验,并对比引入先验/不引入先验的结构与原始网络结构的汉明距离,结果表明所提算法与未引入先验的BDeu评分算法相比显著提高了贝叶斯网络结构学习的准确度。

    优化三元组损失的深度距离度量学习方法
    李子龙, 周勇, 鲍蓉, 王洪栋
    2021, 41(12):  3480-3484.  DOI: 10.11772/j.issn.1001-9081.2021061107
    摘要 ( )   HTML ( )   PDF (581KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对基于三元组损失的单一深度距离度量在多样化数据集环境下适应性差,且容易造成过拟合的问题,提出了一种优化三元组损失的深度距离度量学习方法。首先,对经过神经网络映射的三元组训练样本的相对距离进行阈值化处理,并使用线性分段函数作为相对距离的评价函数;然后,将评价函数作为一个弱分类器加入到Boosting算法中生成一个强分类器;最后,采用交替优化的方法来学习弱分类器和神经网络的参数。通过在图像检索任务中对各种深度距离度量学习方法进行评估,可以看到所提方法在CUB-200-2011、Cars-196和SOP数据集上的Recall@1值比之前最好的成绩分别提高了4.2、3.2和0.6。实验结果表明,所提方法的性能优于对比方法,同时在一定程度上避免了过拟合。

    基于动态概率抽样的标签噪声过滤方法
    张增辉, 姜高霞, 王文剑
    2021, 41(12):  3485-3491.  DOI: 10.11772/j.issn.1001-9081.2021061026
    摘要 ( )   HTML ( )   PDF (1379KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对这一问题,提出一种基于动态概率抽样(DPS)的标签噪声过滤方法,充分考虑各个数据集样本间的差异性,通过统计各个区间内置信度分布频率,分析各个区间内置信度分布信息熵的走势,确定合理阈值。在UCI经典数据集中选取了14个数据集,将所提方法与随机森林(RF)、HARF、MVF、局部概率抽样(LPS)等方法进行了对比实验。实验结果表明,所提出的方法在标签噪声识别和分类泛化上均展示出了较高的能力。

    基于干净数据的流形正则化非负矩阵分解
    李华, 卢桂馥, 余沁茹
    2021, 41(12):  3492-3498.  DOI: 10.11772/j.issn.1001-9081.2021060962
    摘要 ( )   HTML ( )   PDF (663KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的非负矩阵分解(NMF)算法往往基于欧氏距离来设计目标函数,对噪声比较敏感。为了增强算法的鲁棒性,提出一种基于干净数据的流形正则化非负矩阵分解(MRNMF/CD)算法。在MRNMF/CD算法中,把低秩约束、流形正则化和NMF技术无缝地融为一体,使算法性能较为优异。首先,通过添加低秩约束,MRNMF/CD可以从噪声数据中恢复干净数据,并获得数据的全局结构;其次,为了利用数据的局部几何结构信息,MRNMF/CD把流形正则化融入目标函数中。此外,还提出了一种求解MRNMF/CD的迭代算法,并从理论上分析了该求解算法的收敛性。在ORL、Yale和COIL20数据集上的实验结果表明,MRNMF/CD算法比现有的k-means、主成分分析(PCA)、NMF和图正则化非负矩阵分解(GNMF)算法具有更好的识别准确性。

    面向异构单类协同过滤的阶段式变分自编码器
    陈宪聪, 潘微科, 明仲
    2021, 41(12):  3499-3507.  DOI: 10.11772/j.issn.1001-9081.2021060894
    摘要 ( )   HTML ( )   PDF (785KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在推荐系统领域,大部分现有的工作主要关注仅有一种类型的用户反馈(如购买反馈)的单类协同过滤(OCCF)问题。然而,在现实的应用中,用户的反馈往往是异构的,因此如何对用户的异构反馈进行建模从而准确刻画用户的真实偏好成为了一个新的挑战。围绕异构单类协同过滤(HOCCF)问题(包含了用户的购买反馈和浏览反馈),提出了一个迁移学习解决方案——阶段式变分自编码器(SVAE)模型。首先,将用户的浏览反馈当作辅助数据,以多项式变分自编码器(Multi-VAE)为基础模型学习并生成隐特征向量;然后迁移该隐特征向量到另一路Multi-VAE,用于帮助该Multi-VAE对用户的目标数据(即购买反馈)进行建模。三个真实数据集上的实验结果显示,在多数情况下,SVAE模型在精确度(Precision@5)、归一化折损累计增益(NDCG@5)等重要指标上的表现显著优于其他流行的推荐算法,验证了所提模型的有效性

    基于改进的倾向得分估计的无偏推荐模型
    骆锦潍, 刘杜钢, 潘微科, 明仲
    2021, 41(12):  3508-3514.  DOI: 10.11772/j.issn.1001-9081.2021060910
    摘要 ( )   HTML ( )   PDF (567KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现实中推荐系统通常遭受着各种各样的偏置问题,例如曝光偏置、位置偏置和选择偏置。一个忽略偏置问题的推荐模型不能反映推荐系统的真实性能,且对于用户而言可能是不可信任的。先前的工作已经表明基于倾向得分估计的推荐模型能够有效缓解隐式反馈数据的曝光偏置,但是通常只考虑通过物品信息来估计倾向得分,这可能导致倾向得分估计不准确。为了提高倾向得分估计的准确性,提出配对倾向得分估计(MPE)方法。具体来说,该方法引入了用户流行度偏好的概念,通过计算用户流行度偏好和物品流行度的配对程度来对样本曝光率进行更加精确的建模,最后将提出的估计方法和一个主流的传统推荐模型以及一个无偏推荐模型进行集成并和包括前两者的三个基线模型进行对比。在公开数据集上的实验结果表明,结合MPE方法后的模型分别相比对应的基线模型在召回率、折损累计增益(DCG)和平均准确率(MAP)这三个评估指标上均有显著的提升;此外,通过实验结果还观察到性能的增益有很大一部分来自长尾物品,可见所提方法有助于提升推荐物品的多样性与覆盖率。

    融合显/隐式反馈的社会化协同排序推荐算法
    李改, 李磊, 张佳强
    2021, 41(12):  3515-3520.  DOI: 10.11772/j.issn.1001-9081.2021060908
    摘要 ( )   HTML ( )   PDF (631KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传统的基于评分预测的社会化协同过滤推荐算法存在预测值与真实排序不匹配的固有缺陷,而基于排序预测的社会化协同排序推荐算法更符合真实的应用场景。然而,现有的大多数基于排序预测的社会化协同排序推荐算法要么仅仅关注显式反馈数据,要么仅仅关注隐式反馈数据,没有充分挖掘这些数据的价值。为充分挖掘用户的社交网络和推荐对象的显/隐式评分信息,同时克服基于评分预测的社会化协同过滤推荐算法存在的固有缺陷,在xCLiMF模型和TrustSVD模型基础上,提出一种新的融合显/隐式反馈的社会化协同排序推荐算法SPR_SVD++。该算法同时挖掘用户评分矩阵和社交网络矩阵中的显/隐式信息,并优化排序学习的评价指标预期倒数排名(ERR)。在真实数据集上的实验结果表明,采用归一化折损累计增益(NDCG)和ERR作为评价指标,SPR_SVD++算法均优于最新的TrustSVD、MERR_SVD++和SVD++算法。可见SPR_SVD++算法性能好、可扩展性强,在互联网信息推荐领域有很好的应用前景。

    混合式的K-匿名特征选择算法
    杨柳, 李云
    2021, 41(12):  3521-3526.  DOI: 10.11772/j.issn.1001-9081.2021060980
    摘要 ( )   HTML ( )   PDF (619KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    K-匿名算法通过对数据的泛化、隐藏等手段使得数据达到K-匿名条件,在隐藏特征的同时考虑数据的隐私性与分类性能,可以视为一种特殊的特征选择方法,即K-匿名特征选择。K-匿名特征选择方法结合K-匿名与特征选择的特点使用多个评价准则选出K-匿名特征子集。过滤式K-匿名特征选择方法难以搜索到所有满足K-匿名条件的候选特征子集,不能保证得到的特征子集的分类性能最优,而封装式特征选择方法计算成本很大,因此,结合过滤式特征排序与封装式特征选择的特点,改进已有方法中的前向搜索策略,设计了一种混合式K-匿名特征选择算法,使用分类性能作为评价准则选出分类性能最好的K-匿名特征子集。在多个公开数据集上进行实验,结果表明,所提算法在分类性能上可以超过现有算法并且信息损失更小。

    基于指针网络的抽取生成式摘要生成模型
    陈伟, 杨燕
    2021, 41(12):  3527-3533.  DOI: 10.11772/j.issn.1001-9081.2021060899
    摘要 ( )   HTML ( )   PDF (562KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    作为自然语言处理中的热点问题,摘要生成具有重要的研究意义。基于Seq2Seq模型的生成式摘要模型取得了良好的效果,然而抽取式的方法具有挖掘有效特征并抽取文章重要句子的潜力,因此如何利用抽取式方法来改进生成式方法是一个较好的研究方向。鉴于此,提出了融合生成式和抽取式方法的模型。首先,使用TextRank算法并融合主题相似度来抽取文章中有重要意义的句子。然后,设计了融合抽取信息语义的基于Seq2Seq模型的生成式框架来实现摘要生成任务;同时,引入指针网络解决模型训练中的未登录词(OOV)问题。综合以上步骤得到最终摘要,并在CNN/Daily Mail数据集上进行验证。结果表明在ROUGE-1、ROUGE-2和ROUGE-L三个指标上所提模型比传统TextRank算法均有所提升,同时也验证了融合抽取式和生成式方法在摘要生成领域中的有效性。

    融合句法信息的无触发词事件检测方法
    汪翠, 张亚飞, 郭军军, 高盛祥, 余正涛
    2021, 41(12):  3534-3539.  DOI: 10.11772/j.issn.1001-9081.2021060928
    摘要 ( )   HTML ( )   PDF (697KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    事件检测(ED)是信息抽取领域中最重要的任务之一,旨在识别文本中特定事件类型的实例。现有的ED方法通常采用邻接矩阵来表示句法依存关系,然而邻接矩阵往往需要借助图卷积网络(GCN)进行编码来获取句法信息,由此增加了模型的复杂度。为此,提出了融合句法信息的无触发词事件检测方法。通过将依赖父词及其上下文转换为位置标记向量,并在模型源端以无参数的方式融入依赖子词的单词嵌入来加强上下文的语义表征,而不需要经过GCN进行编码;此外,针对触发词的标注费时费力的问题,设计了基于多头注意力机制的类型感知器,以对句子中潜在的触发词进行建模,实现无触发词的事件检测。为了验证所提方法的性能,在ACE2005数据集以及低资源越南语数据集上进行了实验。其中,在ACE2005数据集上与图变换网络事件检测(GTN-ED)方法相比,所提方法的F1值提升了3.7%;在越南语数据集上,与二分类的方法类型感知偏差注意机制神经网络(TBNNAM)相比,所提方法的F1值提升了9%。结果表明,通过在Transformer中融入句法信息能有效地连接句子中分散的事件信息来提高事件检测的准确性。

    基于用户传播网络与消息内容融合的谣言检测模型
    薛海涛, 王莉, 杨延杰, 廉飚
    2021, 41(12):  3540-3545.  DOI: 10.11772/j.issn.1001-9081.2021060963
    摘要 ( )   HTML ( )   PDF (697KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对社交媒体平台上消息内容普遍很短、传播结构中存在大量空转发、用户角色与内容间的失配等条件约束,提出了一种基于传播网络中的用户属性信息和消息内容的谣言检测模型GMB_GMU。首先以用户属性为节点、传播链为边构建用户传播网络,并引入图注意力网络(GAT)得到用户属性的增强表示;同时,基于此用户传播网络,利用node2vec得到用户的结构表征,并使用互注意机制对其进行增强。另外,引入BERT建立源帖内容表征。最后,利用多模态门控单元(GMU)对用户属性表征、结构表征和源帖内容表征进行融合,从而得到消息的最终表征。实验结果表明,GMB_GMU模型在公开的Weibo数据上的准确率达到0.952,能够有效识别谣言事件,效果明显优于基于循环神经网络(RNN)和其他神经网络基准模型的传播算法。

    基于异构图注意力网络的微博谣言监测模型
    毕蓓, 潘慧瑶, 陈峰, 隋京言, 高扬, 王耀君
    2021, 41(12):  3546-3550.  DOI: 10.11772/j.issn.1001-9081.2021060981
    摘要 ( )   HTML ( )   PDF (541KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    社交媒体方便了人们的日常交流和信息传播,同时也是谣言滋生和传播的温床,因此如何在谣言传播早期自动监测极具现实意义,而现有的检测方法没有充分利用微博信息传播图的语义信息。为了解决这个问题,基于异构图注意力网络(HAN)构建了谣言监测模型MicroBlog-HAN。该模型采用含有节点级注意力和语义级注意力的分层注意力机制。首先,节点级注意力结合微博节点的邻居生成两组具有特定语义的节点嵌入;然后,语义级注意力融合不同语义,得到最终的节点嵌入,并输入到分类器中执行二分类任务;最后,给出输入微博是谣言还是非谣言的分类结果。在两个真实的微博谣言数据集上的实验结果表明,MicroBlog-HAN模型可以实现微博谣言较准确的识别,准确率超过87%。

    基于改进Mask R-CNN的越南场景文字检测
    俸亚特, 文益民
    2021, 41(12):  3551-3557.  DOI: 10.11772/j.issn.1001-9081.2021050821
    摘要 ( )   HTML ( )   PDF (1209KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对越南场景文字检测训练数据缺乏及越南文字声调符号检测不全的问题,在改进的实例分割网络Mask R-CNN的基础上,提出一种针对越南场景文字的检测算法。为了准确地分割带声调符号的越南场景文字,该算法仅使用P2特征层来分割文字区域,并将文字区域的掩码矩阵大小从14×14调整为14×28以更好地适应文字区域。针对用常规非极大值抑制(NMS)算法不能剔除重复文字检测框的问题,设计了一个针对文字区域的文本区域过滤模块并添加在检测模块之后,以有效地剔除冗余检测框。使用模型联合训练的方法训练网络,训练过程包含两部分:第一部分为特征金字塔网络(FPN)和区域生成网络(RPN)的训练,训练使用的数据集为大规模公开的拉丁文字数据,目的是增强模型在不同场景下提取文字的泛化能力;第二部分为候选框坐标回归模块和区域分割模块的训练,此部分模型参数使用像素级标注的越南场景文字数据进行训练,使模型能对包括声调符号的越南文字区域进行分割。大量交叉验证实验和对比实验结果表明,与Mask R-CNN相比,所提算法在不同的交并比(IoU)阈值下都具有更好的准确率与召回率。

    B样条曲线融合蚁群算法的机器人路径规划
    李二超, 齐款款
    2021, 41(12):  3558-3564.  DOI: 10.11772/j.issn.1001-9081.2021060888
    摘要 ( )   HTML ( )   PDF (1368KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对蚁群算法在静态环境下全局路径规划存在无法找到最短路径、收敛速度慢、路径搜索盲目性大、拐点多等问题,提出一种改进蚁群算法。以栅格地图为机器人运行环境,对初始信息素进行非均匀分布,使路径搜索更倾向于起点和目标点的连线附近;把当前节点、下一节点和目标点的信息加入启发式函数,同时引入动态调节因子,促使启发函数在迭代前期起主导作用,而后期则加强信息素引导;引入伪随机转移策略,以减少路径选择的盲目性,加快找到最短路径;动态调整挥发系数,使得前期挥发系数大,后期较小,从而避免算法陷入早熟;在最优解的基础上,引入B样条曲线平滑策略,以进一步优化最优解,使得到的路径更短且更加平滑。对改进算法的主要参数进行敏感性分析,并对该算法的各改进环节的可行性与有效性进行了实验,而且在20×20和50×50环境下与传统蚁群算法及其他改进蚁群算法进行仿真对比,实验结果验证了改进算法的可行性、有效性和优越性。

    基于时空上下文信息增强的目标跟踪算法
    温静, 李强
    2021, 41(12):  3565-3570.  DOI: 10.11772/j.issn.1001-9081.2021061034
    摘要 ( )   HTML ( )   PDF (915KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    充分利用视频中的时空上下文信息能明显提高目标跟踪性能,但目前大多数基于深度学习的目标跟踪算法仅利用当前帧的特征信息来定位目标,没有利用同一目标在视频前后帧的时空上下文特征信息,导致跟踪目标易受到邻近相似目标的干扰,从而在跟踪定位时会引入一个潜在的累计误差。为了保留时空上下文信息,在SiamMask算法的基础上引入一个短期记忆存储池来存储历史帧特征;同时,提出了外观显著性增强模块(ASBM),一方面增强跟踪目标的显著性特征,另一方面抑制周围相似目标对目标的干扰。基于此,提出一种基于时空上下文信息增强的目标跟踪算法。在VOT2016、VOT2018、DAVIS-2016和DAVIS-2017等四个数据集上进行实验与分析,结果表明所提出的算法相较于SiamMask算法在VOT2016上的准确率和平均重叠率(EAO)分别提升了4个百分点和2个百分点;在VOT2018上的准确率、鲁棒性和EAO分别提升了3.7个百分点、2.8个百分点和1个百分点;在DAVIS-2016上的区域相似度、轮廓精度指标中的下降率均分别降低了0.2个百分点;在DAVIS-2017上的区域相似度、轮廓精度指标中的下降率分别降低了1.3和0.9个百分点。

    基于图割精细化和可微分聚类的无监督显著性目标检测
    李小雨, 房体育, 夏英杰, 李金屏
    2021, 41(12):  3571-3577.  DOI: 10.11772/j.issn.1001-9081.2021061054
    摘要 ( )   HTML ( )   PDF (1317KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统显著性检测算法分割精度低以及基于深度学习的显著性检测算法对像素级人工注释数据依赖性过强等不足,提出一种基于图割精细化和可微分聚类的无监督显著性目标检测算法。该算法采用由“粗”到“精”的思想,仅利用单张图像的特征便可以实现精确的显著性目标检测。首先利用Frequency-tuned算法根据图像自身的颜色和亮度得到显著粗图,然后根据图像的统计特性进行二值化并结合中心优先假设得到显著目标的候选区域,进而利用基于单图像进行图割的GrabCut算法对显著目标进行精细化分割,最后为克服背景与目标极为相似时检测不精确的困难,引入具有良好边界分割效果的无监督可微分聚类算法对单张显著图做进一步的优化。所提出的算法在ECSSD和SOD数据集上进行测试并与现有的7种算法进行对比,结果表明得到的优化显著图更接近于真值图,在ECSSD和SOD数据集上分别实现了14.3%和23.4%的平均绝对误差(MAE)。

    面向交通流量预测的时空超关系图卷积网络
    张永凯, 武志昊, 林友芳, 赵苡积
    2021, 41(12):  3578-3584.  DOI: 10.11772/j.issn.1001-9081.2021060956
    摘要 ( )   HTML ( )   PDF (1112KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    交通流量预测是智能交通系统中的重要研究课题,然而,交通对象(如站点、传感器)之间存在的复杂局部时空关系使得这项研究颇具挑战。尽管以往的一些研究将流量预测问题转化为一个时空图预测问题从而取得了较大的进展,但是它们忽略了交通对象们跨时空维度的直接关联性。目前仍缺乏一种全面建模局部时空关系的方法。针对这一问题,首先提出一种新颖的时空超图建模方案,通过构造一种时空超关系来全面地建模复杂的局部时空关系;然后提出一种时空超关系图卷积网络(STHGCN)预测模型来捕获这些关系用于交通流量预测。在四个公开交通数据集上进行了大量对比实验,结果表明,相比ASTGCN、时空同步图卷积网络(STSGCN)等时空预测模型,STHGCN在均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)这三个评价指标上均取得了更优的结果,不同模型运行时间的对比结果也表明,STHGCN有着更高的推理速度。

    基于Transformer的多轨音乐生成对抗网络
    汪涛, 靳聪, 李小兵, 帖云, 齐林
    2021, 41(12):  3585-3589.  DOI: 10.11772/j.issn.1001-9081.2021060909
    摘要 ( )   HTML ( )   PDF (639KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    符号音乐的生成在人工智能领域中仍然是一个尚未解决的问题,面临着诸多挑战。经研究发现,现有的多音轨音乐生成方法在旋律、节奏及和谐度上均达不到市场所要求的效果,并且生成的音乐大多不符合基础的乐理知识。为了解决以上问题,提出一种新颖的基于Transformer的多音轨音乐生成对抗网络(Transformer-GAN),以乐理规则为指导来产生具有高音乐性的音乐作品。首先,采用Transformer的译码部分与在Transformer基础之上改编的Cross-Track Transformer(CT-Transformer)分别对单音轨内部及多音轨之间的信息进行学习;然后,使用乐理规则和交叉熵损失相结合的方法引导生成网络的训练,并在训练鉴别网络的同时优化精心设计的目标损失函数;最后,生成具有旋律性、节奏性及和谐性的多音轨音乐作品。实验结果表明,与其他多乐器音乐生成模型相比,在钢琴轨、吉他轨及贝斯轨上,Transformer-GAN的预测精确度(PA)最低分别提升了12%、11%及22%,序列相似度(SS)最低分别提升了13%、6%及10%,休止符指标最低分别提升了8%、4%及17%。由此可见,Transformer-GAN在加入了CT-Transformer及音乐规则奖励模块之后能有效提升音乐的PA、SS等指标,使生成的音乐质量整体上有较大的提升。

    基于灰度域特征增强的行人重识别方法
    龚云鹏, 曾智勇, 叶锋
    2021, 41(12):  3590-3595.  DOI: 10.11772/j.issn.1001-9081.2021061011
    摘要 ( )   HTML ( )   PDF (932KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在显著的类内变化中所学特征是否具有较好的不变性会决定行人重识别(ReID)模型的性能表现的上限,环境光线、图像分辨率变化、运动模糊等因素都会引起行人图像的颜色偏差,这些问题将导致模型对数据的颜色信息过度拟合从而限制模型的性能表现。而模拟数据样本的颜色信息丢失并凸显样本的结构信息可以促进模型学习到更稳健的特征。具体来说,在模型训练时,按照所设定的概率随机选择训练数据批组,然后对所选中批组中的每一个RGB图像样本随机选取图像的一个矩形区域或者直接选取整张图像,并将所选区域的像素替换为相应灰度图像中相同的矩形区域的像素,从而生成包含不同灰度区域的训练图像。实验结果表明,所提方法与基准模型相比在平均精度均值(mAP)评价指标上最高提升了3.3个百分点,并在多个数据集上表现良好。

    基于联合损失胶囊网络的换衣行人重识别
    刘乾, 王洪元, 曹亮, 孙博言, 肖宇, 张继
    2021, 41(12):  3596-3601.  DOI: 10.11772/j.issn.1001-9081.2021061090
    摘要 ( )   HTML ( )   PDF (610KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前的行人重识别(Re-ID)研究主要集中在短时间情形,即一个人的衣着不太可能发生改变的情况。然而现实中更常见的是长时间的情况,这时一个人有很大的机会更换衣服,Re-ID模型应该考虑这种情况。为此,研究了一种基于联合损失胶囊网络的换衣行人重识别方法。所提方法基于换衣行人重识别胶囊网络ReIDCaps,使用与传统的标量神经元相比包含更多信息的矢量胶囊,用其长度表示行人身份信息,用其方向表示行人衣着信息;采用软嵌入注意力(SEA)防止模型过拟合;使用特征稀疏表示(FSR)机制提取具有判别性的特征;增加标签平滑正则化交叉熵损失与Circle Loss的联合损失以提高模型的泛化能力和鲁棒性。在三个换衣行人重识别数据集Celeb-reID、Celeb-reID-light和NKUP上进行实验,实验结果表明所提方法与目前已有的Re-ID方法相比具有一定优势。

    基于人体骨骼关键点的吸烟行为检测算法
    徐婉晴, 王保栋, 黄艺美, 李金屏
    2021, 41(12):  3602-3607.  DOI: 10.11772/j.issn.1001-9081.2021061063
    摘要 ( )   HTML ( )   PDF (1345KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对公共场所的监控视频中烟头目标较小并且吸烟产生的烟雾易发散,仅依靠目标检测算法检测烟头或者烟雾来判定吸烟行为存在较大难度的问题,考虑到利用骨骼关键点来进行姿态估计的算法越来越成熟,提出一种利用人体骨骼关键点和吸烟行为之间的关系来进行吸烟行为检测的算法。该算法首先利用AlphaPose和RetinaFace分别检测出人体骨骼关键点和脸部关键点信息,根据手腕到两嘴角中点和手腕到同侧眼睛的距离之比,提出一种计算人体的吸烟动作比例(SAR)是否属于吸烟动作黄金比例(GRSA)的方法以区分吸烟与非吸烟行为;再利用YOLOv4检测视频中是否存在烟头;最后结合GRSA判定和YOLOv4的结果来确定视频中存在吸烟行为的可能性高低,作出是否有吸烟行为的判定。经过笔者录制的数据集测试,结果表明所提算法可以准确检测到吸烟行为,准确率达到92%。

    基于迁移成分分析和支持向量机的肝移植并发症预测方法
    曹鸿亮, 张莹, 武斌, 李繁菀, 那绪博
    2021, 41(12):  3608-3613.  DOI: 10.11772/j.issn.1001-9081.2021060886
    摘要 ( )   HTML ( )   PDF (699KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    已有很多机器学习算法能够很好地应对预测分类问题,但这些方法在用于小样本、大特征空间的医疗数据集时存在着预测准确率和F1值不高的问题。为改善肝移植并发症预测的准确率和F1值,提出一种基于迁移成分分析(TCA)和支持向量机(SVM)的肝移植并发症预测分类方法。该方法采用TCA进行特征空间的映射和降维,将源领域和目标领域映射到同一再生核希尔伯特空间,从而实现边缘分布自适应;迁移完成之后在源领域上训练SVM,训练完成后在目标领域上实现并发症的预测分析。在肝移植并发症预测实验中,针对并发症Ⅰ、并发症Ⅱ、并发症Ⅲa、并发症Ⅲb、并发症Ⅳ进行预测,与传统机器学习和渐进式对齐异构域适应(HDA)相比,所提方法的准确率提升了7.8%~42.8%,F1值达到85.0%~99.0%,而传统机器学习和HDA由于正负样本不均衡出现了精确率很高而召回率很低的情况。实验结果表明TCA结合SVM能够有效提高肝移植并发症预测的准确率和F1值。

    基于表示学习和深度森林的长链非编码RNA编码短肽预测模型
    纪腾其, 孟军, 赵思远, 胡鹤还
    2021, 41(12):  3614-3619.  DOI: 10.11772/j.issn.1001-9081.2021061082
    摘要 ( )   HTML ( )   PDF (891KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    长链非编码RNA(lncRNA)中的小开放阅读框(sORFs)能够编码长度不超过100个氨基酸的短肽。针对短肽预测研究中lncRNA中的sORFs特征不鲜明且高可信度数据尚不充分的问题,提出一种基于表示学习的深度森林(DF)模型。首先,使用常规lncRNA特征提取方法对sORFs进行编码;其次,通过自编码器(AE)进行表示学习来获得输入数据的高效表示;最后,训练DF模型实现对lncRNA编码短肽的预测。实验结果表明,该模型在拟南芥数据集上能够达到92.08%的准确率,高于传统机器学习模型、深度学习模型以及组合模型,且具有较好的稳定性;此外,在大豆与玉米数据集上进行的模型测试中,该模型的准确率分别能达到78.16%和74.92%,验证了所提模型良好的泛化能力。

    基于局部敏感布隆过滤器的工业物联网隐性异常检测
    肖如良, 曾智霞, 肖晨凯, 张仕
    2021, 41(12):  3620-3625.  DOI: 10.11772/j.issn.1001-9081.2021061115
    摘要 ( )   HTML ( )   PDF (580KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    工业物联网(IIoT)系统中的传感器由于持续使用和正常磨损出现损坏,导致收集和记录的传感数据出现隐性异常。为解决该问题,提出一种基于局部敏感Bloom Filter(LSBF)模型的异常检测算法LSBFAD。首先利用基于空间划分的快速Johnson-Lindenstrauss变换(SP-FJLT)对数据进行哈希映射,然后采用相互竞争(MC)策略进行除噪,最后利用0-1编码构建Bloom Filter。在SIFT、MNIST和FMA三个基准数据集上进行的仿真实验中,LSBFAD算法的误报率(FAR)均低于10%。实验结果表明,基于LSBF的异常检测算法与当前主流的异常检测算法相比,具有较高的检测率(RD)和较低的误报率,可有效应用于IIoT数据的异常检测。

    基于图卷积网络的迁移学习轴承服役故障诊断
    彭雪莹, 江永全, 杨燕
    2021, 41(12):  3626-3631.  DOI: 10.11772/j.issn.1001-9081.2021060974
    摘要 ( )   HTML ( )   PDF (561KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    深度学习方法被广泛应用于轴承故障诊断,但在实际工程应用中,轴承服役期间的真实服役故障数据不易收集,缺乏数据标签,难以进行充分的训练。针对轴承服役故障诊断困难的问题,提出了一种基于图卷积网络(GCN)的迁移学习轴承服役故障诊断模型。该模型从数据充足的人工模拟损伤故障数据中学习故障知识,并迁移到真实的服役故障上,以提高服役故障的诊断准确率。具体来说,通过将人工模拟损伤故障数据和服役故障数据的原始振动信号由小波变换转换为同时具有时间和频率信息的时频图,并将得到的时频图输入到图卷积层中进行学习,从而有效地提取源域和目标域的故障特征表示;然后计算源域和目标域的数据分布之间的Wasserstein距离来度量两个数据分布之间的差异,通过最小化数据分布差异,构建了一个能诊断轴承服役故障的故障诊断模型。在不同的轴承故障数据集和不同工作条件下设计了多种不同的任务进行实验,实验结果表明,该模型具有诊断轴承服役故障的能力,同时也能从一个工作条件迁移到另一工作条件,在不同组件类型和不同工作条件之间进行故障诊断。

    结合公司财务报表数据的股票指数预测方法
    王基厚, 林培光, 周佳倩, 李庆涛, 张燕, 蹇木伟
    2021, 41(12):  3632-3636.  DOI: 10.11772/j.issn.1001-9081.2021061006
    摘要 ( )   HTML ( )   PDF (580KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    股票市场参与者的所有市场活动综合影响着股票市场的变化,使股票市场的波动充满复杂性,也使得准确预测股票价格成为难题。在这些影响股市变化的活动中,财务披露是预测股票指数变化的一种吸引人的且具有潜在财务回报的手段。为了应对股票市场的复杂变化,提出一种结合公司披露的财务报表数据进行股票指数预测的方法。该方法首先对股票指数历史数据和公司财务报表数据进行预处理,主要是对公司财务报表数据生成的高维矩阵进行降维,然后用双通道的长短期记忆(LSTM)网络对归一化后的数据进行预测研究。在上证50指数和沪深300指数数据集上的实验结果表明,该方法的预测效果优于仅使用股票指数历史数据的预测效果。

    人工智能
    基于预训练和多层次信息的中文人物关系抽取模型
    姚博文, 曾碧卿, 蔡剑, 丁美荣
    2021, 41(12):  3637-3644.  DOI: 10.11772/j.issn.1001-9081.2021010090
    摘要 ( )   HTML ( )   PDF (822KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    关系抽取任务旨在从文本中抽取实体对之间的关系,是当前自然语言处理(NLP)领域的热门方向之一。针对中文人物关系抽取语料中语法结构复杂,无法有效学习文本语义特征的问题,提出一个基于预训练和多层次信息的中文人物关系抽取模型(CCREPMI)。该模型首先利用预训练模型较强的语义表征能力生成词向量,并将原始句子分成句子层次、实体层次和实体邻近层次分别进行特征提取,最终融合句子结构特征、实体含义以及实体与邻近词的依赖关系等信息进行关系分类预测。在中文人物关系数据集上的实验结果表明,该模型的精度达到81.5%,召回率达到82.3%,F1值达到81.9%,相比BERT和BERT-LSTM等基线模型有所提升。此外,该模型在SemEval2010-task8英文数据集上的F1值也达到了81.2%,表明它对英文语料具有一定的泛化能力。

    改进的基于谱聚类的子空间聚类模型
    高冉, 陈花竹
    2021, 41(12):  3645-3651.  DOI: 10.11772/j.issn.1001-9081.2021010081
    摘要 ( )   HTML ( )   PDF (1431KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    子空间聚类的目的是将来自不同子空间的数据分割到其本质上所属的低维子空间。现有的基于数据的自我表示和谱聚类的子空间聚类算法将该问题分为两个连续的阶段:首先从高维数据中学习数据的相似性矩阵,然后通过将谱聚类应用于所学相似性矩阵来推断数据的聚类隶属。通过定义一种新的数据自适应稀疏正则项,并将其与结构稀疏子空间聚类(SSSC)模型和改进的稀疏谱聚类(SSpeC)模型相结合,给出了一个新的统一优化模型。新模型利用数据的相似度和聚类指标的相互引导克服了SSpeC稀疏性惩罚的盲目性,并使得相似度具有了判别性,这有利于将不同子空间的数据分为不同类,弥补了SSSC模型只强制来自相同子空间的数据具有相同标签的缺陷。常用数据集上的实验结果表明,所提模型增强了聚类判别的能力,优于一些经典的两阶段法和SSSC模型。

    先进计算
    基于改进磷虾群算法的服务组合优化
    廖水聪, 孙鹏, 刘星辰, 钟贇
    2021, 41(12):  3652-3657.  DOI: 10.11772/j.issn.1001-9081.2021040699
    摘要 ( )   HTML ( )   PDF (703KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    面向服务的架构(SOA)下,针对服务组合优化过程中易陷入局部最优、时间开销大的问题,提出一种加入自适应交叉算子和随机扰动算子的改进磷虾群算法PRKH。首先基于服务质量(QoS)建立了服务组合优化模型,并给出不同结构下QoS的计算公式和归一化处理方法。然后在磷虾群(KH)算法的基础上加入自适应的交叉概率和基于实际偏移量的随机扰动,从而在磷虾群的全局搜索能力和局部搜索能力之间达到良好平衡。最后通过仿真,把所提算法与KH算法、粒子群优化(PSO)算法、人工蜂群(ABC)算法和花朵授粉算法(FPA)进行对比,实验结果表明,PRKH算法能够更快找到QoS更优的复合服务。

    基于动态混合超时的软件定义网络多目标优化
    马晓航, 廖灵霞, 李智, 秦斌, 赵涵捷
    2021, 41(12):  3658-3665.  DOI: 10.11772/j.issn.1001-9081.2021010079
    摘要 ( )   HTML ( )   PDF (1321KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    软件定义网络(SDN)中,流表项是由控制器创建并指导交换机处理数据包的转发规则。流表项保存在交换机的内存并有一定的超时时间,会影响SDN控制通道的带宽消耗、交换机的内存消耗以及系统资源和性能的管理。针对现有SDN性能优化方案大多为单一目标优化,未考虑流表项超时类型和时间对不同优化目标的影响,提出一种基于流表项动态混合超时的多目标优化方案,对大象流的侦测精度、流表项的交换机内存消耗和控制通道带宽占用进行三目标联合优化。动态混合超时将现有的两种流表项超时方式,即硬超时和空闲超时相结合,并对流表项的超时类型和时间进行双维度动态调节。通过NSGA-Ⅱ算法求解所提优化问题,评估不同超时方式和超时时间对三个优化目标的影响,并通过合并特定超时时间下的解集与贝叶斯多目标优化算法的解集对NSGA-Ⅱ算法的解集质量进行改进。结果表明,所提方案能提供更高的侦测精度、更低的带宽占用和更小的交换机内存消耗,明显提升了SDN的综合性能。

    多媒体计算与计算机仿真
    基于密集Inception的单图像超分辨率重建方法
    王海勇, 张开心, 管维正
    2021, 41(12):  3666-3671.  DOI: 10.11772/j.issn.1001-9081.2021010070
    摘要 ( )   HTML ( )   PDF (740KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    近几年,基于卷积神经网络(CNN)的单图像超分辨率(SR)重建方法成为了主流。通常情况下,重建模型的网络层数越深,提取的特征越多,重建效果越好;然而随着网络层数的加深,不仅会出现梯度消失的问题,还会显著增加参数量,增加训练的难度。针对以上问题,提出了一种基于密集Inception的单图像SR重建方法。该方法引入Inception-残差网络(Inception-ResNet)结构提取图像特征,全局采用简化后的密集网络,且仅构建每一个模块输出到重建层的路径,从而避免产生冗余数据来增加计算量。在放大倍数为4时,采用数据集Set5测试模型性能,结果显示与超深卷积神经网络的图像超分辨率(VDSR)相比,所提方法的结构相似性(SSIM)高了0.013 6;与基于多尺度残差网络的图像SR(MSRN)相比,SSIM高了0.002 9,模型参数量少了78%。实验结果表明,所提方法在保证模型的深度和宽度的情况下,显著减少了参数量,从而降低了训练的难度,而且取得了比对比方法更好的峰值信噪比(PSNR)和SSIM。

    基于人工欠曝光融合和白平衡技术的水下图像增强算法
    陶冶, 许文海, 徐鲁强, 郭富城, 蒲海波, 陈广同
    2021, 41(12):  3672-3679.  DOI: 10.11772/j.issn.1001-9081.2021010065
    摘要 ( )   HTML ( )   PDF (2675KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    获得清晰准确的水下图像是人类探索水下世界的重要前置条件。然而与平常图像相比,水下图像往往具有对比度低、细节保留不足及颜色失真等问题,这导致其视觉效果不佳。针对上述问题,提出了基于人工欠曝光融合和白平衡技术(AUF+WB)的水下图像增强算法。首先,利用调节伽马值的方式对原始水下图像进行操作,从而生成5幅相应的欠曝光图像;然后,以对比度、饱和度及良好曝光度作为融合权重,并结合多尺度融合来生成融合图像;最后,将各类颜色通道补偿后的图像分别结合灰色世界假设白平衡生成相应的白平衡图像,再利用水下彩色图像质量评价指标(UCIQE)及水下图像质量评价标准(UIQM)对得到的白平衡图像进行评价。通过选取不同类型的水下图像作为实验样本,将AUF+WB算法与现存先进的水下图像去雾算法进行比较,结果表明AUF+WB算法在图像质量定性、定量两方面分析中和对比算法相比均有更好的表现。所提出的AUF+WB算法可矫正水下图像的颜色失真,并增强其对比度、恢复其细节,有效提升了水下图像的视觉质量。

    基于稀疏卷积的前景实时双目深度估计算法
    邱哲瀚, 李扬
    2021, 41(12):  3680-3685.  DOI: 10.11772/j.issn.1001-9081.2021010076
    摘要 ( )   HTML ( )   PDF (1709KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了提高立体匹配算法处理前景视差估计任务的计算效率,针对一般网络采用完全双目图像作为输入,场景内前景空间占比小而导致输入信息冗余度大的缺点,提出了一种基于稀疏卷积的目标实时立体匹配算法。为实现和改善算法对稀疏前景的视差估计,首先利用分割算法同时获得稀疏前景掩膜和场景语义特征;其次通过稀疏卷积提取稀疏前景区域的空间特征后与场景语义特征相融合,并将融合特征输入到解码模块进行视差回归;最后以前景真值图作为损失生成视差图。在ApolloScape数据集上的测试结果表明,所提算法的准确性和实时性均优于先进算法PSMNet和GANet,且算法的单次运行时间低至60.5 ms,对目标遮挡具有一定的鲁棒性,可用于目标实时深度估计。

    基于增强生成器条件生成对抗网络的单幅图像去雾
    赵扬, 李波
    2021, 41(12):  3686-3691.  DOI: 10.11772/j.issn.1001-9081.2021010092
    摘要 ( )   HTML ( )   PDF (947KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    大气中烟雾等粒子的存在会导致肉眼捕获场景的能见度降低。大多数传统的去雾方法都是预期估计雾霾场景的透射率、大气光,并利用大气散射模型恢复无雾图像。这些方法尽管取得了显著进展,但由于过分依赖苛刻的先验条件,在缺乏相应先验条件下的去雾效果并不理想。因此,提出一种端到端的一体化除雾网络,使用增强生成器的条件生成对抗网络(CGAN)直接恢复无雾图像。生成器端以U-Net作为基础架构,通过“整合-加强-减去”的促进策略,用一个简单有效的增强解码器,增强解码器中特征的恢复。另外,加入了多尺度结构相似性(MS-SSIM)损失函数,增强图像的边缘细节恢复。在合成数据集和真实数据集上的实验中,该模型的峰值信噪比(PSNR)和结构相似性(SSIM)明显优于传统的暗通道先验(DCP)、一体化除雾网络(AOD-Net)、渐进式特征融合网络(PFFNet)、条件Wasserstein生成对抗网络(CWGAN)去雾模型。实验结果表明,相较于对比算法,所提网络能够恢复出更接近于地面真相的无雾图像,除雾效果更优。

    前沿与综合应用
    基于软件体系结构和广义差分进化的测试资源动态分配算法
    邵志胜, 张国富, 苏兆品, 李磊
    2021, 41(12):  3692-3701.  DOI: 10.11772/j.issn.1001-9081.2021010095
    摘要 ( )   HTML ( )   PDF (717KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    测试资源分配是软件测试中的一个基础问题,然而已有研究大都针对并串联模块软件模型而鲜有涉及体系结构软件模型。为此,首先针对可靠性和错误数动态变化的测试环境,构建了一种基于体系结构的多阶段多目标测试资源分配模型。然后基于参数重估计、种群重新初始化、广义差分进化和归一化加权求和设计了一种面向动态可靠性和错误数的多阶段多目标测试资源分配算法。最后,在仿真实验中,与已有的归一化加权求和多目标差分进化(WNS-MODE)算法进行对比,所提算法在不同结构的体系结构软件模型实例上所获解集更优,容量值提高了约16倍,覆盖值提高了约84个百分点,超体积提高了约6倍。实验结果表明,所提算法能够更好地适应可靠性和错误数的动态变化,可为体系结构软件模型的动态测试提供更多和更优的测试资源分配方案。

    基于L-Metric重叠子图发现的B细胞表位预测模型
    高闯, 唐冕, 赵亮
    2021, 41(12):  3702-3706.  DOI: 10.11772/j.issn.1001-9081.2021010017
    摘要 ( )   HTML ( )   PDF (499KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有表位预测方法对抗原中存在的重叠表位预测能力不佳的问题,提出了将基于局部度量(L-Metric)的重叠子图发现算法用于表位预测的模型。首先,利用抗原上的表面原子构建原子图并升级为氨基酸残基图;然后,利用基于信息流的图划分算法将氨基酸残基图划分为互不重叠的种子子图,并使用基于L-Metric的重叠子图发现算法对种子子图进行扩展以得到重叠子图;最后,利用由图卷积网络(GCN)和全连接网络(FCN)构建的分类模型将扩展后的子图分类为抗原表位和非抗原表位。实验结果表明,所提出的模型在相同数据集上的F1值与现有表位预测模型DiscoTope 2、ElliPro、EpiPred和Glep相比分别提高了267.3%、57.0%、65.4%和3.5%。同时,消融实验结果表明,所提出的重叠子图发现算法能够有效改善预测能力,使用该算法的模型相较于未使用该算法的模型的F1值提高了19.2%。

2022年 42卷 3期
刊出日期: 2022-03-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会