当期目录

    2019年 第39卷 第11期 刊出日期:2019-11-10
    2019年中国粒计算与知识发现学术会议(CGCKD2019)论文
    带权超网络的度量方法及其性质
    刘胜久, 李天瑞, 杨宗霖, 珠杰
    2019, 39(11):  3107-3113.  DOI: 10.11772/j.issn.1001-9081.2019050806
    摘要 ( )   PDF (913KB) ( )  
    参考文献 | 相关文章 | 计量指标
    超网络是较通常意义上的复杂网络更为复杂的网络,该网络的每一条超边能连接任意多个节点的特性使其比复杂网络能更好地描述真实世界中的复杂系统。针对现有超网络研究中对超网络度量方法的缺陷与不足,提出了一种超网络度量方法——超网络维数(HD),即为所有超边包含的节点权重之和与对应超边权重乘积和的对数值和节点权重之和与超边权重之和乘积对数值的比值的两倍。超网络维数可以应用于节点权重与超边权重为正实数、负实数、纯虚数,乃至复数等多种不同数值类型的带权超网络中。最后给出了超网络维数的若干性质。
    模糊规则模型的粒度性能指标评估方法
    胡星辰, 申映华, 吴克宇, 程光权, 刘忠
    2019, 39(11):  3114-3119.  DOI: 10.11772/j.issn.1001-9081.2019050791
    摘要 ( )   PDF (925KB) ( )  
    参考文献 | 相关文章 | 计量指标
    模糊规则模型广泛应用于许多领域,而现有的模糊规则模型主要使用基于数值形式的性能评估指标,忽略了对于模糊集合本身的评价,因此提出了一种模糊规则模型性能评估的新方法。该方法可以有效地评估模糊规则模型输出结果的非数值(粒度)性质。不同于通常使用的数值型性能指标(比如均方误差(MSE)),该方法通过信息粒的特征来表征模型输出的粒度结果的质量,并将该指标使用在模糊模型的性能优化中。信息粒性能采用(数据的)覆盖率和(信息粒自身的)特异性两个基本指标得以量化,并通过使用粒子群优化实现了粒度输出质量(表示为覆盖率和特异性的乘积)的最大化。此外,该方法还优化了模糊聚类形成的信息粒的分布。实验结果表明该指标对于模糊规则模型性能评估的有效性。
    面向聚类集成的基聚类三支筛选方法
    徐健锋, 邹伟康, 梁伟, 程高洁, 张远健
    2019, 39(11):  3120-3126.  DOI: 10.11772/j.issn.1001-9081.2019050864
    摘要 ( )   PDF (985KB) ( )  
    参考文献 | 相关文章 | 计量指标
    当前聚类集成的研究主要是围绕着集成策略的优化展开,而针对基聚类质量的度量及优化却较少研究。基于信息熵理论提出了一种基聚类的质量度量指标,并结合三支决策思想构造了面向基聚类的三支筛选方法。首先预设基聚类筛选三支决策的阈值α、β,然后计算各基聚类中类簇质量的平均值,并把其作为各基聚类的质量度量指标,最后实施三支决策。决策策略为:当某个基聚类的质量度量指标小于阈值β时,删除该基聚类;当某个基聚类的质量度量指标大于等于阈值α时,保留该基聚类;当某个基聚类的质量度量指标大于等于β小于α时,重新计算该基聚类质量,并且再次实施上述三支决策直至没有基聚类被删除或达到指定迭代次数。对比实验结果表明,基聚类三支筛选方法能够有效提升聚类集成效果。
    面向不平衡文本情感分类的三支决策特征选择方法
    万志超, 胡峰, 邓维斌
    2019, 39(11):  3127-3133.  DOI: 10.11772/j.issn.1001-9081.2019050822
    摘要 ( )   PDF (1114KB) ( )  
    参考文献 | 相关文章 | 计量指标
    传统的特征选择方法在面对不平衡文本情感倾向性分类时会有很大的局限性,这种局限性主要体现在特征维数过高、特征过于稀疏和特征分布不平衡,这会使得分类的准确度大幅度下降。根据不平衡文本情感特征分布的特点,结合三支决策的思想,提出了一种面向不平衡文本情感分类的三支决策特征选择方法(TWD-FS)。该方法将两种有监督特征选择方法相结合,将选择出的特征词进一步筛选,使得最终选择出的特征词同时满足类间离散度最大和类内离散度最小的特点,有效地减少了特征词的数量,降低了特征维度;此外,通过组合正负类情感特征,缓解了情感特征的不平衡性,有效提高了不平衡样本中少数类情感的分类效果。在COAE2013中文微博非平衡数据集等多个数据集上的实验结果表明,所提的特征选择算法TWD-FS可以有效提高不平衡文本情感分类的准确度。
    基于概率的支持向量数据描述方法
    杨晨, 王婕婷, 李飞江, 钱宇华
    2019, 39(11):  3134-3139.  DOI: 10.11772/j.issn.1001-9081.2019050823
    摘要 ( )   PDF (849KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前概率机器学习方法在解决概率问题时具有较高的复杂度,而传统的支持向量数据描述(SVDD)作为一种核密度估计方法只能判断测试样本是否属于该类等问题,提出一种基于概率的支持向量数据描述方法。首先,利用传统的SVDD方法分别得到两类数据的数据描述,计算测试样本到超球体的距离;然后,构造一个将距离转换为概率的函数,提出一种基于概率的SVDD方法;同时,使用Bagging算法进行集成,进一步提高数据描述的性能。借鉴分类场景,将所提方法与传统的SVDD方法在Gunnar Raetsch的13种基准数据集上进行实验,实验结果表明,所提方法在准确率和F1值上优于传统的SVDD方法,并且其数据描述的性能有所提升。
    变精度多粒度粗糙集近似集更新的矩阵算法
    郑文彬, 李进金, 于佩秋, 林艺东
    2019, 39(11):  3140-3145.  DOI: 10.11772/j.issn.1001-9081.2019050836
    摘要 ( )   PDF (801KB) ( )  
    参考文献 | 相关文章 | 计量指标
    随着信息大爆炸时代的到来,数据集的巨大化和数据集结构的复杂化已经成为近似计算中不能忽视的问题,而动态计算是解决这些问题的一种行之有效的途径。对现有的应用于经典多粒度粗糙集动态近似集更新方法进行了改进,提出了应用于变精度多粒度粗糙集(VPMGRS)的向量矩阵近似集计算与更新方法。首先,提出了一种基于向量矩阵的VPMGRS近似集静态计算算法;其次,重新考虑了VPMGRS近似集更新时的搜索区域,并根据VPMGRS的性质缩小了该区域,有效地提升了近似集更新算法的时间效率;再次,根据新的搜索区域,在VPMGRS近似集静态计算算法的基础上提出了一种新的VPMGRS近似集更新的向量矩阵算法;最后,通过实验验证了所提算法的有效性。
    基于一维卷积神经网络的蛋白质-ATP绑定位点预测
    张寓, 於东军
    2019, 39(11):  3146-3150.  DOI: 10.11772/j.issn.1001-9081.2019050865
    摘要 ( )   PDF (775KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了提高预测腺嘌呤核苷三磷酸(ATP)绑定位点的准确率,提出了一种基于一维卷积神经网络(1D-CNN)的方法。首先,以蛋白质的序列信息为基础,融合位置特异性得分矩阵信息、二级结构信息和水溶性信息,使用随机下采样的方法消除数据不平衡的影响,再对缺失的特征进行再编码补齐,得到训练特征。训练一个1D-CNN来预测蛋白质-ATP绑定位点,优化网络结构,并且进行实验来对比所提方法和其他机器学习方法的优劣。实验结果展示了所提方法的有效性,并且该方法与传统支持向量机(SVM)相比在AUC指标上有部分的提升。
    2019年中国计算机学会人工智能会议(CCFAI2019)论文
    面向属性网络的重叠社区发现算法
    杜航原, 裴希亚, 王文剑
    2019, 39(11):  3151-3157.  DOI: 10.11772/j.issn.1001-9081.2019051177
    摘要 ( )   PDF (1064KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对现实世界的网络节点中包含大量属性信息并且社区之间呈现出重叠特性的问题,提出了一种面向属性网络的重叠社区发现算法。融合网络的拓扑结构和节点属性定义了节点的密集度和间隔度,分别用于描述社区内部连接紧密和外部连接松散的特点。基于密度峰值聚类的思想搜索局部密度中心作为社区中心,在此基础上给出了非中心节点关于各个社区的隶属度的迭代计算方法,实现了重叠社区的划分。在真实数据集上进行了仿真实验,实验结果表明所提算法相对于LINK、COPRA和DPSCD能获得更好的社区划分结果。
    基于距离融合的图像特征点匹配方法
    修春波, 马云菲, 潘肖楠
    2019, 39(11):  3158-3162.  DOI: 10.11772/j.issn.1001-9081.2019051180
    摘要 ( )   PDF (867KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对ORB算法中特征点缺乏尺度不变性导致算法误匹配率高,以及二进制鲁棒独立基本特征(BRIEF)算法的描述子易受噪声影响的问题,提出了改进的特征点匹配方法。采用加速的具有鲁棒性的特征(SURF)算法进行特征点提取,利用带有方向信息的BRIEF算法进行特征点描述;在特征点邻域内选取随机点对,并对随机点对的灰度大小比较和相似度比较分别进行编码,采用汉明距离计算两种编码的差异;利用自适应加权融合的方式实现特征点相似性距离度量。实验结果表明,改进方法对于尺度变化、光照变化以及模糊变化的图像具有更好的适应性,与传统ORB特征点匹配方法相比能够获得更高的特征点正确匹配率,且该特征点匹配方法可用于改善图像拼接的性能。
    基于云综合方法的三支群决策模型
    李帅, 王国胤, 杨洁
    2019, 39(11):  3163-3171.  DOI: 10.11772/j.issn.1001-9081.2019051050
    摘要 ( )   PDF (1342KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在三支决策问题中,领域专家群决策是一种确定损失函数的最直接方法。相较于体现单一不确定性的语言变量模型和模糊集模型,云模型描述的专家评价更能够反映认知过程中复杂的不确定性形式,并能通过云综合的方法获得综合评价函数。但当前的云综合方法仅对数字特征进行简单的线性组合,缺乏对概念语义差异上的描述,难以获得令人信服的结果。因此首先证明了在云模型的距离空间中赋权距离和是一个凸函数,并将综合云模型定义为此函数的最小值点。然后,将该定义推广到多个云模型的场景下,提出了一种新的云综合方法——基于密度中心的云综合方法。群决策过程中,该方法在保证综合评价与基础评价之间的相似度最高的同时获得最精确的综合评价,为损失函数的确定提供了一种新的语义解释。实验结果表明,在与简单线性组合和合理粒度方法对比中,该方法所确定的损失函数使得三支决策中的误分类率最低。
    基于特征提取偏好与背景色相关性的数据增强算法
    余鹰, 王乐为, 张应龙
    2019, 39(11):  3172-3177.  DOI: 10.11772/j.issn.1001-9081.2019051140
    摘要 ( )   PDF (1039KB) ( )  
    参考文献 | 相关文章 | 计量指标
    深度神经网络具有强大的特征自学习能力,可以通过多层逐步提取的方式获取不同层次的粒度特征,但当图片目标本体与背景色具有强相关性时,特征提取会存在"惰性",所提取特征的抽象层次较低,判别性不足。针对此问题,通过实验对深度神经网络特征提取的内在规律进行研究,发现特征提取偏好与图片背景色之间具有相关性,消除该相关性可以帮助深度神经网络忽略背景的干扰,直接学习目标本体的特征,由此提出了数据增强算法,并在自主构建的数据集上进行实验。实验结果表明,所提算法可以降低背景色对目标本体特征提取的干扰,减少过拟合,提高分类效果。
    融合地点影响力的兴趣点推荐算法
    许朝, 孟凡荣, 袁冠, 李月娥, 刘肖
    2019, 39(11):  3178-3183.  DOI: 10.11772/j.issn.1001-9081.2019051087
    摘要 ( )   PDF (935KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为解决兴趣点(POI)推荐不准确和效率低的问题,深入分析社交因素和地理位置因素的影响,提出了一种融合地点影响力的POI推荐算法。首先,为了解决签到数据稀疏的问题,将2-度好友引入协同过滤算法中构建了社交影响模型,通过计算经历和好友相似度获取2-度好友对用户的社交影响;其次,深入考虑地理位置因素对POI推荐影响,在对社交网络分析的基础上构造了地点影响力模型,通过PageRank算法发现用户影响力,结合POI被签到次数计算地点影响力,获取准确的整体位置偏好,并使用核密度估计方法对用户签到行为建模和获取个性化地理位置特征;最后,融合社交模型和地理位置模型提高推荐准确性,并通过构造POI推荐候选集来提高推荐效率。在Gowalla和Yelp签到数据集上实验,结果表明所提算法能够快速完成POI推荐,在准确率和召回率指标上明显优于融合时间因素的位置推荐(LRT)和融合地理社交因素的个性化位置推荐(iGSLR)算法。
    基于DBSCAN算法和多源数据的缺失公交到站数据修补
    王成, 崔紫薇, 杜梓林, 高悦尔
    2019, 39(11):  3184-3190.  DOI: 10.11772/j.issn.1001-9081.2019051033
    摘要 ( )   PDF (1091KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对缺失公交到站信息修补方法考虑因素较少、准确度低、鲁棒性差的现状,提出了基于DBSCAN算法和多源数据的缺失公交到站数据修补方法。该方法使用公交全球定位系统(GPS)、公交集成电路卡(IC)等多源数据进行缺失到站信息的修补。对于缺失的到站名称、到站经纬度数据,用已有完整到站数据和静态线路信息关联分析进行修补。对于缺失的到站时刻数据,则按以下步骤进行修补:首先,对每一个缺失数据站点与其最近的未缺失数据站点,将这两站点间历史完整到站数据的行程时间和班次时序进行基于DBSCAN算法的聚类;其次,判断研究班次的两个相邻的数据完整的班次所属簇是否为同一个簇,若为同一个簇则不作改变,否则将两个簇合并;最后,将簇中点对应最大行程时间作为缺失行程时间判断是否有乘客在该站点上车刷卡,若有则由乘客开始刷卡时刻推算到站时刻,若无则将簇中点对应最大、最小行程时间的均值作为缺失行程时间推算到站时刻。以厦门市公交到站数据为例,在缺失到站名称、经纬度修补中,基于GPS数据聚类的方法、基于极大概率估计的方法和所提方法皆可进行100%的修补;在缺失到站时刻修补中,所提方法的平均相对误差比两种对比方法分别低0.0301%和0.0004%,相关系数比对比方法分别高0.005和0.0075。实验结果表明,所提算法在缺失公交到站数据修补中能有效提高修补的准确度,降低缺失站点个数变化对于准确度的影响。
    基于Pareto分布的众包工人欺骗行为处理方法
    潘庆先, 江珊, 董红斌, 王莹洁, 潘廷伟, 殷增轩
    2019, 39(11):  3191-3197.  DOI: 10.11772/j.issn.1001-9081.2019051067
    摘要 ( )   PDF (1013KB) ( )  
    参考文献 | 相关文章 | 计量指标
    由于众包的组织模式自由松散,致使众包工人在完成任务的过程中存在欺骗行为。如何识别工人的欺骗行为并降低其影响,从而保障众包任务的完成质量,已经成为众包领域的研究热点之一。通过对任务结果的评估与分析,针对众包工人统一型欺骗行为,提出了一种基于广义Pareto分布(GPD)的权重设置算法(WSABG)。该算法对GPD进行极大似然估计,并用二分法逼近似然函数的零点以计算出尺度参数σ和形状参数ε。算法中定义了新的权重公式,并利用众包工人完成当前任务的反馈数据赋予每位工人一个绝对影响权重,最终设计出了基于GPD的众包工人权重设置框架。所提算法可以解决任务结果数据之间差异性小且容易集中在两极的问题。以烟台大学学生评教数据为实验数据集,提出了区间转移矩阵的概念,证明了WSABG算法的有效性和优势。
    基于知识图嵌入的跨社交网络用户对齐算法
    滕磊, 李苑, 李智星, 胡峰
    2019, 39(11):  3198-3203.  DOI: 10.11772/j.issn.1001-9081.2019051143
    摘要 ( )   PDF (862KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前跨社交网络用户对齐算法存在的网络嵌入效果不佳、负采样方法所生成负例质量无法保证等问题,提出一种基于知识图嵌入的跨社交网络用户对齐(KGEUA)算法。在嵌入阶段,利用部分已知的种子锚用户对进行正例扩充,并提出Near_K负采样方法生成负例,最后利用知识图嵌入方法将两个社交网络嵌入到统一的低维向量空间中。在对齐阶段,针对目前的用户相似度度量方法进行改进,将提出的结构相似度与传统的余弦相似度结合共同度量用户相似度,并提出基于自适应阈值的贪心匹配方法对齐用户,最后将新对齐的用户对加入到训练集中以持续优化向量空间。实验结果表明,提出的算法在Twitter-Foursquare数据集上的hits@30值达到了67.7%,比用户对齐现有最佳算法的结果高出3.3~34.8个百分点,显著提升用户对齐效果。
    多层次结构生成对抗网络的文本生成图像方法
    孙钰, 李林燕, 叶子寒, 胡伏原, 奚雪峰
    2019, 39(11):  3204-3209.  DOI: 10.11772/j.issn.1001-9081.2019051077
    摘要 ( )   PDF (1012KB) ( )  
    参考文献 | 相关文章 | 计量指标
    近年来,生成对抗网络(GAN)在从文本描述到图像的生成中已经取得了显著成功,但仍然存在图像边缘模糊、局部纹理不清晰以及生成样本方差小等问题。针对上述不足,在叠加生成对抗网络模型(StackGAN++)基础上,提出了一种多层次结构生成对抗网络(MLGAN)模型,该网络模型由多个生成器和判别器以层次结构并列组成。首先,引入层次结构编码方法和词向量约束来改变网络中各层次生成器的条件向量,使图像的边缘细节和局部纹理更加清晰生动;然后,联合训练生成器和判别器,借助多个层次的生成图像分布共同逼近真实图像分布,使生成样本方差变大,增加生成样本的多样性;最后,从不同层次的生成器生成对应文本的不同尺度图像。实验结果表明,在CUB和Oxford-102数据集上MLGAN模型的Inception score分别达到了4.22和3.88,与StackGAN++相比,分别提高了4.45%和3.74%。MLGAN模型在解决生成图像的边缘模糊和局部纹理不清晰方面有了一定提升,其生成的图像更接近真实图像。
    基于改进的Mask R-CNN的行人细粒度检测算法
    朱繁, 王洪元, 张继
    2019, 39(11):  3210-3215.  DOI: 10.11772/j.issn.1001-9081.2019051051
    摘要 ( )   PDF (935KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2:5)使12种anchors适应图像中行人的尺寸;然后,结合细粒度图像识别技术,实现行人的高定位精度;其次,采用全卷积网络(FCN)分割前景对象,并进行像素预测获得行人的局部掩码(上半身、下半身),实现对行人的细粒度检测;最后,通过学习行人的局部特征获得行人的整体掩码。为了验证改进算法的有效性,将其与当前具有代表性的目标检测方法(如更快速的区域卷积神经网络(Faster R-CNN)、YOLOv2、R-FCN)在同数据集上进行对比。实验结果表明,改进的算法提高了行人检测的速度和精度,并且降低了误检率。
    基于时空正则化的视频序列中行人的再识别
    刘保成, 朴燕, 唐悦
    2019, 39(11):  3216-3220.  DOI: 10.11772/j.issn.1001-9081.2019051084
    摘要 ( )   PDF (808KB) ( )  
    参考文献 | 相关文章 | 计量指标
    由于现实复杂情况中各种因素的干扰,行人再识别的过程中可能出现识别错误等问题。为了提高行人再识别的准确性,提出了一种基于时空正则化的行人再识别算法。首先,利用ResNet-50网络对输入的视频序列逐帧进行特征提取,将一系列帧级特征输入到时空正则化网络并产生对应的权重分数;然后,对帧级特征使用加权平均得到视频序列级特征,为避免权重分数聚集在一帧,使用帧级正则化来限制帧间差异;最后,通过最小化损失得到最优结果。在DukeMTMC-ReID和MARS数据集中做了大量的测试,实验结果表明,所提方法与Triplet算法相比能够有效提高行人再识别的平均精度(mAP)和准确率,并且对于人体姿势变化、视角变化和相似外观目标的干扰具有出色的性能表现。
    改进的属性约简算法及其在肝癌微血管侵犯预测中的应用
    谭永奇, 樊建聪, 任延德, 周晓明
    2019, 39(11):  3221-3226.  DOI: 10.11772/j.issn.1001-9081.2019051108
    摘要 ( )   PDF (896KB) ( )  
    参考文献 | 相关文章 | 计量指标
    基于邻域粗糙集的属性约简算法在进行属性约简时只考虑单一属性对决策属性的影响,未能考虑各属性间的相关性,针对这个问题,提出了一种基于卡方检验的邻域粗糙集属性约简算法(ChiS-NRS)。首先,利用卡方检验计算相关性,在筛选重要属性时考虑相关属性之间的影响,在降低时间复杂度的同时提高了分类准确率;然后,将改进的算法与梯度提升决策树(GBDT)算法组合以建立分类模型,并在UCI数据集上对模型进行验证;最后,将该模型应用于预测肝癌微血管侵犯的发生。实验结果表明,与未约简、邻域粗糙集约简等几种约简算法相比,改进算法在一些UCI数据集上的分类准确率最高;在肝癌微血管侵犯预测中,与卷积神经网络(CNN)、支持向量机(SVM)、随机森林(RF)等预测模型相比,提出的模型在测试集上的预测准确率达到了88.13%,其灵敏度、特异度和受试者操作曲线(ROC)的曲线下面积(AUC)分别为87.10%、89.29%和0.90,各指标都达到了最好。因此,所提模型能更好地预测肝癌微血管侵犯的发生,能辅助医生进行更精确的诊断。
    基于半监督模糊C均值算法的遥感影像分类
    冯国政, 徐金东, 范宝德, 赵甜雨, 朱萌, 孙潇
    2019, 39(11):  3227-3232.  DOI: 10.11772/j.issn.1001-9081.2019051043
    摘要 ( )   PDF (1151KB) ( )  
    参考文献 | 相关文章 | 计量指标
    遥感影像数据因其固有的不确定性与复杂性,导致传统的无监督分类算法难以对其准确建模。基于模糊集理论的模式识别方法可以有效地表达数据的模糊性,其中二型模糊集能更好地刻画类间多重不确定性,而半监督法可以利用少量先验知识来解决算法对数据的泛化性问题,因此提出一种基于半监督的自适应区间二型模糊C均值遥感影像分类方法(SS-AIT2FCM)。首先,结合半监督和进化论思想,提出一种新的模糊权重指数选取方法,以提升自适应区间二型模糊C均值聚类算法的鲁棒性与泛化性,使算法更适用于光谱混叠严重、覆盖面积大、地物丰富的遥感数据分类;然后,通过对少量标记样本的软约束监督,对区间二型模糊算法迭代过程进行优化指导,来挖掘数据的最优表达。实验选用了北京颐和园区域的SPOT5多光谱遥感影像数据和广东横琴岛区域的Landsat TM多光谱遥感影像数据,对现有流行的模糊分类算法和SS-AIT2FCM的分类结果进行了比较。结果表明,SS-AIT2FCM获得了更高的分类精度与更清晰的类别边界,且有较好数据泛化能力。
    人工智能
    基于超球形模糊支配的高维多目标粒子群优化算法
    谭阳, 唐德权, 曹守富
    2019, 39(11):  3233-3241.  DOI: 10.11772/j.issn.1001-9081.2019040710
    摘要 ( )   PDF (1319KB) ( )  
    参考文献 | 相关文章 | 计量指标
    高维多目标优化问题(MAOP)会随着待优化问题维度的增加形成巨大的目标空间,导致在目标空间中非支配解的比例急剧增加,削弱了进化算法的选择压力,降低了进化算法对MAOP的求解效率。针对这一问题,提出一种以超球型支配关系降低种群中非支配解数量的粒子群优化(PSO)算法。算法以模糊支配策略来维持种群对MAOP的选择压力,并通过全局极值的选择和外部档案的维护来保持种群个体在目标空间中的分布。在标准测试集DTLZ和WFG上的仿真结果表明,所提算法在求解MAOP时具备较优的收敛性和分布性。
    一种高效的经验回放模块设计
    陈勃, 王锦艳
    2019, 39(11):  3242-3249.  DOI: 10.11772/j.issn.1001-9081.2019050810
    摘要 ( )   PDF (1237KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对深度Q网络(DQN)应用中基于python数据结构直接实现的经验回放过程时常成为性能瓶颈,提出一种具有高性能及通用性的经验回放模块设计方案。该设计方案具有两层软件结构:底层的功能内核由C++语言实现,以提供较高的执行效率;上层则由python语言编写,以面向对象的方式封装模块功能并提供调用接口,使模块具有较高易用性。针对经验回放所涉及的关键操作,一些技术细节被充分研究和精心设计,例如,将优先级回放机制作为附属组件与模块的主体运行逻辑分离,将样本的可抽取性验证提前到样本记录操作中进行,使用高效的样本淘汰策略与算法等。这些措施使模块具有较高的通用性和可扩展性。实验结果表明,按照该模块实现的经验回放过程,整体执行效率得到了充分优化,两个关键操作——样本记录与样本抽取,皆可高效执行。与基于python数据结构的直接实现方式相比,所提模块在样本抽取操作上的性能提升了约100倍,从而避免了经验回放过程成为整个系统的性能瓶颈,满足了各类DQN相关应用项目的需要。
    批量流水调度问题的量子候鸟协同优化算法
    陈林烽, 齐学梅, 陈俊文, 黄琤, 陈付龙
    2019, 39(11):  3250-3256.  DOI: 10.11772/j.issn.1001-9081.2019040700
    摘要 ( )   PDF (949KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了求解批量流水调度问题(LFSP)的最小化最大完工时间,提出一种量子候鸟协同优化(QMBCO)算法。首先,采用Bloch量子球面编码方案扩大解空间;然后,运用FL算法优化初始解,以弥补传统随机初始解的不足,保证初始种群具有较高的质量;最后,使用候鸟优化(MBO)算法及变邻域搜索(VNS)算法进行迭代,增强算法的全局搜索能力。采用随机生成不同规模的实例仿真,将QMBCO算法与目前较优的离散粒子群优化(DPSO)算法、MBO算法和量子布谷鸟协同搜索(QCCS)算法相比较。结果表明,在两种不同运行时间下QMBCO与DPSO、MBO、QCCS相比产生的最优解平均百分比偏差(ARPD)分别平均下降65%、34%和24%,证明了QMBCO算法的有效性和高效性。
    基于Levy飞行的萤火虫模糊聚类算法
    刘晓明, 沈明玉, 侯整风
    2019, 39(11):  3257-3262.  DOI: 10.11772/j.issn.1001-9081.2019040634
    摘要 ( )   PDF (858KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对模糊C均值(FCM)聚类算法易受初始聚类中心影响而陷入局部最优问题,提出了一种基于Levy飞行的萤火虫模糊聚类算法(LFAFCM)。该算法改变萤火虫算法的随机移动策略,以平衡算法局部搜索和全局搜索能力;萤火虫位置更新过程中引入Levy飞行机制,以提高全局寻优能力;根据迭代次数和萤火虫位置动态调整每个萤火虫的尺度系数,以限制Levy飞行可搜索范围,并加快算法收敛速度。利用5个UCI数据集对算法进行实验验证,实验结果表明,该算法有效避免了陷入局部最优并具有较快的收敛速度。
    基于多特征的微博突发事件检测算法
    王雪颖, 杨文忠, 张志豪, 李东昊, 秦旭
    2019, 39(11):  3263-3267.  DOI: 10.11772/j.issn.1001-9081.2019040647
    摘要 ( )   PDF (810KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了降低社交媒体中突发事件带来的危害,提出一种基于多特征的微博突发事件检测算法。该算法融合了文本情感过滤和用户影响力计算方法。首先,通过噪声过滤和情感过滤得到饱含负面情感的微博文本;然后,采用提出的用户影响力计算方法并结合突发词提取算法来提取突发词特征;最后,引入凝聚式层次聚类算法对突发词集进行聚类,从中提取突发事件。通过实验检测,准确率为66.84%,验证了该方法能有效地对突发事件进行检测。
    基于双微阵列与卷积神经网络的语音识别方法
    刘伟波, 曾庆宁, 卜玉婷, 郑展恒
    2019, 39(11):  3268-3273.  DOI: 10.11772/j.issn.1001-9081.2019050878
    摘要 ( )   PDF (938KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为解决噪声环境下语音识别率降低以及传统波束形成算法难以处理空间噪声的问题,基于双微阵列结构提出了一种改进的最小方差无畸变响应(MVDR)波束形成方法。首先,采用对角加载提高双微阵列增益,并利用递归矩阵求逆降低计算复杂度;然后,通过后置调制域谱减法对语音作进一步处理,解决了一般谱减法容易产生音乐噪声的问题,有效减小了语音畸变,获得了良好的噪声抑制效果;最后,采用卷积神经网络(CNN)进行语音模型的训练,提取语音深层次的特征,有效地解决了语音信号多样性问题。实验结果表明,提出的方法在经CNN训练的语音识别系统模型中取得了较好的识别效果,在信噪比为10 dB的F16噪声环境下的语音识别率达到了92.3%,具有良好的稳健性。
    基于3D深度残差网络与级联U-Net的缺血性脑卒中病灶分割算法
    王平, 高琛, 朱莉, 赵俊, 张晶, 孔维铭
    2019, 39(11):  3274-3279.  DOI: 10.11772/j.issn.1001-9081.2019040717
    摘要 ( )   PDF (959KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了解决人工勾画缺血性脑卒中病灶费时费力且易引入主观差异的问题,提出了一种基于三维(3D)深度残差网络与级联U-Net的自动分割算法。首先,为了有效利用图像的3D上下文信息并改善类不平衡现象,将脑卒中核磁共振图像(MRI)采样成图像块作为网络输入;然后,利用基于3D深度残差网络与级联U-Net的分割模型对图像块进行特征提取,获得粗分割结果;最后,对粗分割结果进行精分割处理。在ISLES数据集上的实验结果表明,该算法的Dice系数可达到0.81,精确度可达到0.81,灵敏度可达到0.81,平均对称表面距离(ASSD)距离系数为1.32,HD为22.67。所提算法与3D U-Net算法、基于水平集算法、基于模糊C均值(FCM)算法和基于卷积神经网络(CNN)算法相比分割性能更好。
    数据科学与技术
    高维不确定数据的子空间聚类算法
    万静, 郑龙君, 何云斌, 李松
    2019, 39(11):  3280-3287.  DOI: 10.11772/j.issn.1001-9081.2019050928
    摘要 ( )   PDF (1411KB) ( )  
    参考文献 | 相关文章 | 计量指标
    如何降低不确定数据对高维数据聚类的影响是当前的研究难点。针对由不确定数据与维度灾难导致的聚类精度低的问题,采用先将不确定数据确定化,后对确定数据聚类的方法。在将不确定数据确定化的过程中,将不确定数据分为值不确定数据与维度不确定数据,并分别处理以提高算法效率。采用结合期望距离的K近邻(KNN)查询得到对聚类结果影响最小的不确定数据近似值以提高聚类精度。在得到确定数据之后,采用子空间聚类的方式避免维度灾难的影响。实验结果证明,基于Clique的高维不确定数据聚类算法(UClique)在UCI数据集上有较好的表现,有良好的抗噪声能力和伸缩性,在高维数据上能得到较好的聚类结果,在不同的不确定数据集实验中能够得到较高精度的实验结果,体现出算法具有一定的健壮性,能够有效地对高维不确定数据集聚类。
    融合潜在狄利克雷分布与元路径分析的用户相关性度量方法
    徐红艳, 王丹, 王富海, 王嵘冰
    2019, 39(11):  3288-3292.  DOI: 10.11772/j.issn.1001-9081.2019040728
    摘要 ( )   PDF (837KB) ( )  
    参考文献 | 相关文章 | 计量指标
    用户相关性度量是异构信息网络研究的基础与核心。现有的用户相关性度量方法由于未充分开展多维度分析和链路分析,其准确性尚存在提升空间。为此,提出了一种融合狄利克雷分布(LDA)与元路径分析的用户相关性度量方法。首先利用LDA进行主题建模,通过分析网络中节点的内容来计算节点的相关性;然后,引入元路径来刻画节点间关系类型,通过关联度量(DPRel)方法对异构信息网络中的用户进行相关性测量;接着,将节点的相关性融入到用户相关性度量计算中;最后,采用IMDB真实电影数据集进行实验,将所提方法和嵌入LDA主题模型的协同过滤推荐方法(ULR-CF)、基于元路径的相关性度量方法(PathSim)进行了对比分析。实验结果表明,所提方法能够克服数据稀疏性弊端,提高用户相关性度量的准确性。
    基于轮廓系数的参数无关空中交通轨迹聚类方法
    孙石磊, 王超, 赵元棣
    2019, 39(11):  3293-3297.  DOI: 10.11772/j.issn.1001-9081.2019040738
    摘要 ( )   PDF (818KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为消除专家经验的主观性、避免依赖轨迹特征并且减轻实验调参的负担,提出一种基于轮廓系数的参数无关聚类分析(PICBASIC)算法。首先,比较了现有基于欧氏距离的航迹配对方法,并且建立基于动态时间弯曲(DWT)距离和高斯核函数的轨迹相似度计算模型;其次,利用谱聚类对空中交通轨迹进行聚类划分;最后,提出一种基于轮廓系数的最佳簇数寻优方法,并且其具有对聚类结果量化评价功能。利用真实进场轨迹进行实验验证,PICBASIC判断将28L跑道的365条轨迹聚为5个簇,28R跑道的530条轨迹聚为6个簇时聚类质量最佳,平均轮廓系数分别为0.8099和0.8056。相同实验数据条件下,PICBASIC与MeanShift聚类的平均轮廓系数差异率分别为-1.23%和0.19%。实验结果表明:PICBASIC包容轨迹的速度和长度差异,全程无需人工指导或实验调参,而且能够筛除异常轨迹对聚类质量的不利影响。
    网络空间安全
    基于系统理论过程分析的安全关键软件安全性验证方法
    王鹏, 吴康, 阎芳, 汪克念, 张啸晨
    2019, 39(11):  3298-3303.  DOI: 10.11772/j.issn.1001-9081.2019040688
    摘要 ( )   PDF (969KB) ( )  
    参考文献 | 相关文章 | 计量指标
    现代安全关键系统的功能实现越来越依赖于软件,这导致软件的安全性对系统安全至关重要,而软件的复杂性使得采用传统安全性分析方法很难捕获组件交互过程带来的危险。为保证安全关键系统的安全性,提出一种基于系统理论过程分析(STPA)的软件安全性验证方法。在安全控制结构基础上,通过构建带有软件过程模型变量的过程模型,细化分析危险行为发生的系统上下文信息,并以此生成软件安全性需求。然后通过设计起落架控制系统软件,采用模型检验技术对软件进行安全性验证。结果表明,所提方法能够在系统级层面有效识别出软件中潜在的危险控制路径,并可以减少对人工分析的依赖。
    基于马尔可夫模型的云系统安全性与性能建模
    许瀚, 罗亮, 孙鹏, 孟飒
    2019, 39(11):  3304-3309.  DOI: 10.11772/j.issn.1001-9081.2019020257
    摘要 ( )   PDF (981KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对云环境缺乏安全性评估的问题,提出一种评估系统安全性的建模方法,并建立了云环境下的安全性-性能(S-P)关联模型。首先,针对云系统中最重要的组成部分,即虚拟机,建立了评估其安全性的模型,该模型充分反映了安全机制和恶意攻击两个安全因素对虚拟机的影响;随后基于虚拟机与云系统之间的关系,提出评估云系统安全性的指标;其次,提出一种分层建模方法来建立S-P关联模型。利用队列理论对云计算系统的性能进行建模,然后基于贝叶斯理论和相关分析建立了安全性和性能之间的关联关系,并提出评估复杂S-P相关性的新指标。实验结果验证了理论模型的正确性,并揭示了安全因素引起的性能动态变化规律。
    基于互信息加权集成迁移学习的入侵检测方法
    胡健, 苏永东, 黄文载, 肖鹏, 刘玉婷, 杨本富
    2019, 39(11):  3310-3315.  DOI: 10.11772/j.issn.1001-9081.2019040730
    摘要 ( )   PDF (906KB) ( )  
    参考文献 | 相关文章 | 计量指标
    入侵检测系统(IDS)已成为网络安全体系结构中的必要组成部分。在面对现代网络安全需求时,现有的入侵检测方法的可行性和持续性仍然存在提高空间,主要体现在更早地发现入侵威胁和提高入侵检测系统的检测精准度,为此提出一种基于互信息加权的集成迁移学习(ETL)入侵检测方法。首先,通过迁移策略对多组特征集进行建模;然后,使用互信息度量在迁移模型下特征集在不同域中的数据分布;最后,根据度量值对多个迁移模型进行集成加权,得到集成迁移模型。该方法通过学习新环境下的少量有标记样本和以往环境下的大量有标记样本的知识,可以建立效果优于传统非集成、非迁移的入侵检测模型。使用基准NSL-KDD数据集对该方法进行评估,实验结果表明,所提方法具有良好的收敛性能,并提高了入侵检测的精准率。
    基于访问控制列表机制的Android权限管控方案
    曹震寰, 蔡小孩, 顾梦鹤, 顾小卓, 李晓伟
    2019, 39(11):  3316-3322.  DOI: 10.11772/j.issn.1001-9081.2019040685
    摘要 ( )   PDF (1141KB) ( )  
    参考文献 | 相关文章 | 计量指标
    Android采用基于权限的访问控制方式对系统资源进行保护,其权限管控存在管控力度过粗的问题。同时,部分恶意程序会在用户不知情的情况下,在隐私场景下偷偷地对资源进行访问,给用户隐私和系统资源带来一定的威胁。在原有权限管控的基础上引入了访问控制列表(ACL)机制,设计并实现了一个基于ACL机制的Android细粒度权限管控系统。所提系统能根据用户的策略动态地设置应用程序的访问权限,避免恶意代码的访问,保护系统资源。对该系统的兼容性、有效性的测试结果表明,该系统能够为应用程序提供稳定的环境。
    先进计算
    kn方体的可靠性评估
    冯凯, 李婧
    2019, 39(11):  3323-3327.  DOI: 10.11772/j.issn.1001-9081.2019040714
    摘要 ( )   PDF (648KB) ( )  
    参考文献 | 相关文章 | 计量指标
    并行计算机系统功能的实现很大程度上依赖于系统互连网络的性能。为了精确度量以kn方体为底层拓扑结构的并行计算机系统的容错能力,研究了点故障模型下kn方体中k元(n-1)方体子网络的可靠性。当k ≥ 3且为奇数时,分别在固定划分模式和灵活划分模式下对kn方体中不同数目的k元(n-1)方体子网络保持无故障状态的平均失效时间进行了分析,并得出了这一子网络可靠性评估参数的计算公式。结果表明,当基于k为奇数的kn方体构建的并行计算机系统指派子网络执行用户任务时,在点故障模型下灵活划分模式相比固定划分模式有着更好的容错能力。
    云环境下方差定向变异遗传算法的任务调度
    孙敏, 叶侨楠, 陈中雄
    2019, 39(11):  3328-3332.  DOI: 10.11772/j.issn.1001-9081.2019040635
    摘要 ( )   PDF (814KB) ( )  
    参考文献 | 相关文章 | 计量指标
    云环境下遗传算法(GA)的任务调度存在寻优能力差、结果不稳定等问题。对于上述问题,提出了一种基于方差与定向变异的遗传算法(V-DVGA)。在选择部分,在每一次迭代的过程中进行多次选择,利用数学方差来保证种群的多样性并扩大较优解的搜索范围。在交叉部分,建立新的交叉机制,丰富种群的多样性并提高种群整体的适应度。在变异部分,优化变异机制,在传统变异的基础上采用定向变异来提高算法的寻优能力。通过workflowSim平台进行云环境仿真实验,将此算法与经典的遗传算法和当前的基于遗传算法的工作流调度算法(CWTS-GA)进行比较。实验结果表明,在相同的设置条件下,该算法在执行效率、寻优能力和稳定性等方面优于其他两个算法,是一种云计算环境下有效的任务调度算法。
    云数据中心基于贪心算法的虚拟机迁移策略
    刘开南
    2019, 39(11):  3333-3338.  DOI: 10.11772/j.issn.1001-9081.2019040598
    摘要 ( )   PDF (916KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了节省云数据中心的能量消耗,提出了几种基于贪心算法的虚拟机(VM)迁移策略。这些策略将虚拟机迁移过程划分为物理主机状态检测、虚拟机选择和虚拟机放置三个步骤,并分别在虚拟机选择和虚拟机放置步骤中采用贪心算法予以优化。提出的三种迁移策略分别为:最小主机使用效率选择且最大主机使用效率放置算法MinMax_Host_Utilization、最大主机能量使用选择且最小主机能量使用放置算法MaxMin_Host_Power_Usage、最小主机计算能力选择且最大主机计算能力放置算法MinMax_Host_MIPS。针对物理主机处理器使用效率、物理主机能量消耗、物理主机处理器计算能力等指标设置最高或者最低的阈值,参考贪心算法的原理,在指标上超过或者低于这些阈值范围的虚拟机都将进行迁移。利用CloudSim作为云数据中心仿真环境的测试结果表明,基于贪心算法的迁移策略与CloudSim中已存在的静态阈值迁移策略和绝对中位差迁移策略比较起来,总体能量消耗少15%,虚拟机迁移次数少60%,平均SLA违规率低5%。
    网络与通信
    基于自相关增量的载波参数解耦合技术
    王思秀, 张蕾, 任艳, 冯长征
    2019, 39(11):  3339-3342.  DOI: 10.11772/j.issn.1001-9081.2019040682
    摘要 ( )   PDF (619KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在高速移动通信系统中,收发双方往往面临较大多普勒频移和有限导频开销两个问题,从而严重影响传统载波同步模式(TCSP)的整体性能。为此,提出了一种基于自相关增量的载波参数解耦合技术(CPEDT),并应用到传统载波同步模式(CPEDT-TCSP)中。首先在接收端任取一段导频信号进行去调制操作,然后对去调制信号进行有效延迟长度为α的相关运算,一方面利用该相关运算的结果作频偏估计,另一方面利用取α为导频长度一半的相关运算结果的共轭形式与去调制信号一同作最大似然相偏估计。理论分析和仿真结果表明,当导频初始位置为零时,提出的CPEDT-TCSP可以实现TCSP中频偏估计和相偏估计的解耦合,同时能够使最大似然相偏估计的复乘运算量由L降为1,从而更加适用于高速移动通信。
    基于蜂窝网结构的多目标自动辨识定位方法
    苗晟, 董亮, 董建娥, 钟丽辉
    2019, 39(11):  3343-3348.  DOI: 10.11772/j.issn.1001-9081.2019040672
    摘要 ( )   PDF (905KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对移动蜂窝网对多目标难以检测识别且定位精度不高的问题,提出一种基于蜂窝网结构的多目标自动辨识定位方法。首先,根据对监测区域内目标源的多次定位结果方差来判别是否有多目标存在;其次,采用k-means无监督学习对定位点进行聚类,由于k-means算法的最优簇数难以确定,因此提出了一种基于波束分辨率的k值裂变算法来确定k值,并确定聚类中心;最后,为了提高接收信号的信噪比,通过各聚类中心确定波束方向,再使用基于线性约束的窄带波束形成器依次接收不同波束方向信号,分别对各目标源进行到达时间差定位。仿真结果表明,对于解决多目标定位问题,相对于时延估计算法和概率假设密度(PHD)滤波器算法,所提多目标自动辨识定位方法能够提高接收信号约10 dB的信噪比,对应的时延估计误差的克拉美罗下界能够下降约67%,定位精度相对误差可提高10个百分点以上,而且算法简洁有效,各次定位相对独立,具有较高的效率和较好的稳定性。
    虚拟现实与多媒体计算
    基于RGB和关节点数据融合模型的双人交互行为识别
    姬晓飞, 秦琳琳, 王扬扬
    2019, 39(11):  3349-3354.  DOI: 10.11772/j.issn.1001-9081.2019040633
    摘要 ( )   PDF (993KB) ( )  
    参考文献 | 相关文章 | 计量指标
    基于RGB视频序列的双人交互行为识别已经取得了重大进展,但因缺乏深度信息,对于复杂的交互动作识别不够准确。深度传感器(如微软Kinect)能够有效提高全身各关节点的跟踪精度,得到准确的人体运动及变化的三维关节点数据。依据RGB视频和关节点数据的各自特性,提出一种基于RGB和关节点数据双流信息融合的卷积神经网络(CNN)结构模型。首先,利用Vibe算法获得RGB视频在时间域的感兴趣区域,之后提取关键帧映射到RGB空间,以得到表示视频信息的时空图,并把图送入CNN提取特征;然后,在每帧关节点序列中构建矢量,以提取余弦距离(CD)和归一化幅值(NM)特征,将单帧中的余弦距离和关节点特征按照关节点序列的时间顺序连接,馈送入CNN学习更高级的时序特征;最后,将两种信息源的softmax识别概率矩阵进行融合,得到最终的识别结果。实验结果表明,将RGB视频信息和关节点信息结合可以有效地提高双人交互行为识别结果,在国际公开的SBU Kinect interaction数据库和NTU RGB+D数据库中分别达到92.55%和80.09%的识别率,证明了提出的模型对双人交互行为识别的有效性。
    基于区域分割的低覆盖点云配准算法
    汤慧, 周明全, 耿国华
    2019, 39(11):  3355-3360.  DOI: 10.11772/j.issn.1001-9081.2019040727
    摘要 ( )   PDF (916KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对低覆盖点云配准的时间复杂度高、收敛速度缓慢以及对应点匹配易错等问题,提出一种基于区域分割的点云配准算法。首先,利用体积积分不变量计算点云上点的凹凸性,并提取凹凸特征点集;然后,采用基于混合流形谱聚类的分割算法对特征点集进行区域分割,并采用基于奇异值分解(SVD)的迭代最近点(ICP)算法对区域进行配准,从而实现点云的精确配准。实验结果表明,所提算法通过区域分割可以大幅提高点云区域的覆盖率,并且无需迭代即可计算刚体变换的最佳旋转矩阵,其配准精度比已有算法提高了10%以上,配准时间降低了20%以上。因此,所提算法是一种精度高、速度快的低覆盖点云配准算法。
    基于深度学习的超声图像左心耳自动分割方法
    韩路易, 黄韫栀, 窦浩然, 白文娟, 刘奇
    2019, 39(11):  3361-3365.  DOI: 10.11772/j.issn.1001-9081.2019040771
    摘要 ( )   PDF (885KB) ( )  
    参考文献 | 相关文章 | 计量指标
    从超声图像中分割出左心耳(LAA)是得出临床诊断指标的重要步骤,而准确自动分割的首要步骤和难点就是实现目标的自动定位。针对这一问题,提出了一种结合基于深度学习框架的自动定位和基于模型的分割算法的方法来实现超声图像中LAA的自动分割。首先,训练YOLO模型作为LAA自动定位的网络架构;其次,通过验证集确定最优的权重文件,并预测出LAA的最小包围盒;最后,在正确定位的基础上,将YOLO预测的最小包围盒放大1.5倍作为初始轮廓,利用C-V模型完成LAA的自动分割。分割结果用5项指标加以评价:正确性、敏感性、特异性、阴性、阳性。实验结果表明,所提方法能够实现不同分辨率条件和不同显示模式下LAA的自动定位,小样本数据在1000次迭代时已经达到最优的定位效果,正确定位率达到72.25%,并且在正确定位的基础上,C-V模型的分割准确率能够达到98.09%。因此,深度学习技术在实现LAA超声图像的自动分割上具备较大的潜力,能够为基于轮廓的分割算法提供良好的初始轮廓。
    基于空间约束的模糊C均值聚类肝脏CT图像分割
    王荣淼, 张峰峰, 詹蔚, 陈军, 吴昊
    2019, 39(11):  3366-3369.  DOI: 10.11772/j.issn.1001-9081.2019040611
    摘要 ( )   PDF (693KB) ( )  
    参考文献 | 相关文章 | 计量指标
    传统模糊C均值(FCM)聚类算法应用于肝脏CT图像分割时仅考虑像素本身特征,无法解决灰度不均匀造成的影响以及肝脏边界模糊造成的边界泄露的问题。为解决上述问题,提出一种结合空间约束的模糊C均值(SFCM)聚类分割算法。首先,使用二维高斯分布函数构建卷积核,利用该卷积核对源图像进行空间信息提取得到特征矩阵;然后,引入空间约束惩罚项,更新并优化目标函数得到新的迭代方程;最后,通过多次迭代,完成对肝脏CT图像的分割。实验结果表明,SFCM算法分割具有灰度不均匀和边界粘连的肝脏CT图像时得到的肝脏轮廓形状更加规则,准确率达到92.8%,比FCM和直觉模糊C均值(IFCM)算法的分割准确率分别提升了2.3和4.3个百分点,过分割率分别降低了4.9和5.3个百分点。
    应用前沿、交叉与综合
    基于融合时空数据的车辆加油行为多视图深度异常检测框架
    丁景全, 马博, 李晓
    2019, 39(11):  3370-3375.  DOI: 10.11772/j.issn.1001-9081.2019040670
    摘要 ( )   PDF (988KB) ( )  
    参考文献 | 相关文章 | 计量指标
    车辆加油时空数据多源异构、关系复杂,现有成熟的异常检测方法难以对时空离散的加油活动数据进行分析,因此提出基于融合时空数据的车辆加油行为多视图深度异常检测框架。首先基于统一概念模型(UCM)对静态信息和动态活动数据进行关联融合管理,然后从空间视图、时间视图和语义视图角度对时空数据进行编码和转换,最后基于三种视图构建深度时空异常分析检测框架。车辆加油时空数据集上的实验结果表明,多种异常检测方法在融合时空数据上均可取得更低均方根误差(RMSE),平均降低10.73%,所提方法比现有主流方法中结果最好的长短时记忆网络(LSTM)的RMSE降低19.36%。在信用卡欺诈公开数据集上的实验结果表明,所提方法较之逻辑回归模型,马修斯系数(MCC)提高了32.78%。以上实验验证了所提方法的有效性。
    作业车间环境下的采购生产配送联合调度模型
    张维存, 高蕊, 张曼
    2019, 39(11):  3383-3390.  DOI: 10.11772/j.issn.1001-9081.2019040712
    摘要 ( )   PDF (1160KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对生产-配送联合调度(IPDS)模型较少考虑复杂生产环境以及采购环节的问题,建立了在作业车间环境下,以最小化订单完成时间为目标的采购-生产-配送联合调度(IPPDS)模型,并采用改进的动态人工蜂群(DABC)算法进行求解。根据IPPDS问题的特征,首先,采用二维实数矩阵的编码方式,实现任务(加工与运输)与资源(设备与车辆)的匹配关系;其次,采用基于工艺过程的解码方式,并在解码过程中针对不同任务设计了满足约束条件的方法,来保证解码方案的可行性;最后,在算法过程中设计了引领蜂与跟随蜂的动态协调机制和局部启发式信息。通过实验给出DABC适当的参数区间,对比实验结果表明,IPPDS策略相较于分段调度和IPDS策略,调度时间分别缩短了35.59%和30.95%;DABC相较于人工蜂群(ABC)算法求解效果平均提升了2.54%,相对于改进的遗传算法(AGA)求解效果平均提升了6.99%。因此,IPPDS策略能更快速地满足客户需求,而DABC算法既减少需设置的参数,又具有良好的探索和开发能力。
    大气污染暴露风险防控可视化决策支持平台
    谢静, 邹滨, 李沈鑫, 赵秀阁, 邱永红
    2019, 39(11):  3391-3397.  DOI: 10.11772/j.issn.1001-9081.2019040693
    摘要 ( )   PDF (1104KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对当前我国大气污染防治正逐步由污染治理转向风险防控,而现有空气质量监测设备和平台服务仅限于环境监测而非暴露监测的问题,设计研发了一套基于B/S架构的可视化综合分析与决策支持平台——大气污染暴露风险测量系统(APERMS)。首先,基于大气污染浓度监测数据和暴露时空行为活动模式,耦合集成污染浓度制图、个体暴露测量、人群暴露测量、暴露风险评价这一完整的大气污染暴露风险测量技术路线;其次,基于高可用和可靠原则,进行系统的总体架构设计、数据库设计和功能模块设计;最终,采用GIS与J2EE Web等技术,完成APERMS开发,实现了大气污染浓度分布高时空分辨率模拟、个体和人群大气污染暴露状况精准评估、大气污染暴露风险水平全方位评价等功能。APERMS主要应用于大气污染监控和环境健康管理行业,为风险规避和污染防控提供有效的技术支持。
    基于用户网络嵌入的民宿房源推荐方法
    刘彤, 曾诚, 何鹏
    2019, 39(11):  3398-3402.  DOI: 10.11772/j.issn.1001-9081.2019040721
    摘要 ( )   PDF (793KB) ( )  
    参考文献 | 相关文章 | 计量指标
    随着民宿行业的迅速发展,在线民宿订房系统开始流行起来。让用户在海量房源信息中快速找到所需房源是订房系统中待解决的问题。针对房源推荐中用户冷启动与数据稀疏性的问题,提出基于网络嵌入法的房源个性化推荐(UNER)方法。首先通过用户在系统中的历史行为数据及标签信息构建两类用户网络;然后基于网络嵌入法将网络映射至低维向量空间中,得到用户节点的向量表示并通过用户向量计算用户相似度矩阵;最后依据该矩阵为用户进行房源推荐。实验数据来源于贵州"水东乡舍"民宿订房系统。实验结果表明,相对于基于用户的协同过滤算法,所提方法的综合评价指标(F1)提升了20个百分点,平均正确率(MAP)提升11个百分点,体现出该方法的优越性。
    嵌入互联网舆情强度的人民币汇率预测
    王吉祥, 过弋, 戚天梅, 王志宏, 李真, 汤敏伟
    2019, 39(11):  3403-3408.  DOI: 10.11772/j.issn.1001-9081.2019040726
    摘要 ( )   PDF (914KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前人民币汇率预测研究存在的数据源单一导致难以提升预测效果的问题,提出一种嵌入互联网舆情强度的预测技术,通过融合多方面数据源进行对比分析,有效降低了人民币汇率的预测误差。首先,融合互联网外汇新闻数据和历史行情数据,并将多源文本数据转化为可计算的特征向量;其次,通过情感特征向量构建五种特征组合并对其进行对比,给出了嵌入互联网舆情强度的特征组合作为预测模型输入;最后,设计外汇舆情影响汇率预测的滑动时间窗口,建立基于机器学习的汇率预测模型。实验结果表明,嵌入互联网舆情的特征组合相对于不含舆情的特征组合在均方根误差(RMSE)和平均绝对误差(MAE)上分别提升了9.8%和16.2%;此外,长短期记忆网络(LSTM)预测模型比支持向量回归(SVR)、决策回归(DT)和深度神经网络(DNN)预测模型表现更好。
    基于边划分理论的谣言传播模型
    罗靖宇, 唐宁九
    2019, 39(11):  3409-3414.  DOI: 10.11772/j.issn.1001-9081.2019040739
    摘要 ( )   PDF (1024KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对谣言传播过程中传播态节点恢复时会受其邻居节点状态影响的问题,提出了一种基于边划分理论的谣言传播模型。首先,使用改进的边划分理论建立起谣言传播的动力学方程组,推演出谣言在复杂网络上的传播范围值和爆发阈值;然后,通过数值仿真实验研究网络结构、传播概率和基础恢复概率等参数对谣言传播的影响;在此基础之上,提出了可以有效控制谣言传播范围和爆发阈值的免疫策略。理论分析和仿真结果表明,与经典的SIR模型相比,提出的谣言传播模型缩短了谣言传播的周期,传播态节点比例的峰值则有小幅提高。对比实验发现,与现有的随机免疫策略相比,当谣言的传播概率较大时,优先免疫连接小度节点的边能得到更小的谣言传播范围;反之,当谣言的传播概率较小时,优先免疫连接大度节点的边可以有更小的谣言传播范围。研究结果表明,提出的谣言传播模型符合谣言消退期的特征,为谣言传播的预测与控制提供了理论和数值上的支持。
2022年 42卷 1期
刊出日期: 2022-01-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:成都市武侯区人民南路四段9号
   中国科学院成都分院
   《计算机应用》编辑部(610041)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会