当期目录

    2018年 第38卷 第10期 刊出日期:2018-10-10
    2018中国粒计算与知识发现学术会议(CGCKD 2018)论文
    基于不确定服务质量感知的云服务组合方法
    王思臣, 涂辉, 张以文
    2018, 38(10):  2753-2758.  DOI: 10.11772/j.issn.1001-9081.2018041187
    摘要 ( )   PDF (868KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对不确定服务质量(QoS)感知的云服务组合优化问题的求解,提出一种不定长时间序列(ULST)模型和锦标赛策略的改进遗传算法(T-GA)。首先,基于用户对服务不同时间段的访问规律,将服务质量的长期变化构建为不定长时间序列模型,该模型能够准确地描述一段时间内用户对服务的真实QoS访问记录。其次,提出一种基于不确定QoS模型的改进遗传算法,该算法采用锦标赛选择策略代替基本遗传算法中的轮盘赌选择策略。最后,在真实数据上进行了大量实验,所提的不定长时间序列模型能够有效地解决不确定QoS感知云服务组合问题,而锦标赛策略的改进遗传算法在寻优结果和稳定性方面均优于基于精英选择策略的遗传算法(E-GA)算法,且运行速度提高近1倍,是可行、高效且稳定的算法。
    基于MapReduce的大数据主动学习
    翟俊海, 张素芳, 王聪, 沈矗, 刘晓萌
    2018, 38(10):  2759-2763.  DOI: 10.11772/j.issn.1001-9081.2018041141
    摘要 ( )   PDF (751KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对传统的主动学习算法只能处理中小型数据集的问题,提出一种基于MapReduce的大数据主动学习算法。首先,在有类别标签的初始训练集上,用极限学习机(ELM)算法训练一个分类器,并将其输出用软最大化函数变换为一个后验概率分布。然后,将无类别标签的大数据集划分为l个子集,并部署到l个云计算节点上。在每一个节点,用训练出的分类器并行地计算各个子集中样例的信息熵,并选择信息熵大的前q个样例进行类别标注,将标注类别的l×q个样例添加到有类别标签的训练集中。重复以上步骤直到满足预定义的停止条件。在Artificial、Skin、Statlog和Poker 4个数据集上与基于ELM的主动学习算法进行了比较,结果显示,所提算法在4个数据集上均能完成主动样例选择,而基于ELM的主动学习算法只在规模最小的数据集上能完成主动样例选择。实验结果表明,所提算法优于基于极限学习机的主动学习算法。
    变精度下不完备混合数据的增量式属性约简方法
    王映龙, 曾淇, 钱文彬, 舒文豪, 黄锦涛
    2018, 38(10):  2764-2771.  DOI: 10.11772/j.issn.1001-9081.2018041293
    摘要 ( )   PDF (1260KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了解决当不完备混合决策系统中数据动态增加时,静态属性约简方法的计算复杂度高的问题,提出变精度下不完备混合数据的增量式属性约简方法。首先,在变精度模型下给出了利用条件熵度量属性的重要性程度;然后,详细分析和设计了当数据动态增加时条件熵的增量式更新变化情况和属性约简的更新机制;在此基础上,利用启发式贪心策略构造了增量式的属性约简算法,实现了不完备的数值型和符号型混合数据下属性约简的动态更新。通过UCI数据集中五个真实的混合型数据集的实验比较和分析,在约简效果方面,利用增量式属性约简算法处理Echocardiogram、Hepatitis、Autos、Credit和Dermatology数据集的增量规模为90%+10%时,数据集的原属性个数分别由12、19、25、17和34个约简至6、7、10、11和13个,分别占原属性集的50.0%、36.8%、40.0%、64.7%和38.2%;在执行时间方面,增量式算法在五个数据集的平均耗时分别为2.99 s、3.13 s、9.70 s、274.19 s和50.87 s,静态算法的平均耗时分别为284.92 s、302.76 s、1062.23 s、3510.79 s和667.85 s,且增量式算法的耗时与数据集的实例规模、属性个数和属性值类型的分布相关。实验结果表明,增量式属性约简算法在计算耗时方面要显著优于静态算法,且能有效剔除数据中的冗余属性。
    基于代表的留一法集成学习分类
    王轩, 张林, 高磊, 蒋昊坤
    2018, 38(10):  2772-2777.  DOI: 10.11772/j.issn.1001-9081.2018041101
    摘要 ( )   PDF (862KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为应对抽样不均匀带来的影响,以基于代表的分类算法为基础,提出一种用于符号型数据分类的留一法集成学习分类算法(LOOELCA)。首先采用留一法获得n个小训练集,其中n为初始训练集大小。然后使用每个训练集构建独立的基于代表的分类器,并标注出分类错误的分类器及对象。最后,标注分类器和原始分类器形成委员会并对测试集对象进行分类。如委员会表决一致,则直接给该测试对象贴上类标签;否则,基于k最近邻(kNN)算法并利用标注对象对测试对象分类。在UCI标准数据集上的实验结果表明,LOOELCA与基于代表的粗糙集覆盖分类(RBC-CBNRS)算法相比,精度平均提升0.35~2.76个百分点,LOOELCA与ID3、J48、Naïve Bayes、OneR等方法相比也有更高的分类准确率。
    基于多中心卷积特征加权的图像检索方法
    朱杰, 张俊三, 吴树芳, 董宇坤, 吕琳
    2018, 38(10):  2778-2781.  DOI: 10.11772/j.issn.1001-9081.2018041100
    摘要 ( )   PDF (674KB) ( )  
    参考文献 | 相关文章 | 计量指标
    深度卷积特征能够为图像内容描述提供丰富的语义信息,为了在图像表示中突出对象内容,结合激活映射中较大响应值与对象区域的关系,提出基于多中心卷积特征加权的图像表示方法。首先,通过预训练深度模型提取出图像卷积特征;其次,通过不同通道特征映射求和得到激活映射,并将激活映射中有较大响应值的位置认为是对象的中心;再次,将中心数量作为尺度,结合激活映射中不同位置与中心的距离为对应位置的描述子加权;最后,合并不同中心数量下的图像特征,生成图像表示用于图像检索。与池化卷积(SPoC)算法和跨维度(CroW)算法相比,所提方法能够为图像表示提供尺度信息的同时突出对象内容,并在Holiday、Oxford和Paris图像集中取得了良好的检索结果。
    信息熵约束下的视频目标分割
    丁飞飞, 杨文元
    2018, 38(10):  2782-2787.  DOI: 10.11772/j.issn.1001-9081.2018041099
    摘要 ( )   PDF (992KB) ( )  
    参考文献 | 相关文章 | 计量指标
    大部分基于图论的视频分割方法往往先通过分析运动和外观信息获得先验显著性区域,然后用最小化能量模型来进一步分割,这些方法常常忽略对外观信息精细化分析,建立的目标模型对复杂场景的鲁棒性不佳。根据信息熵能够度量样本纯度,信息熵最小化和能量模型最小化具有一致的目标,提出一种信息熵约束下的视频目标分割方法。首先在经典光流法基础上结合点在多边形内部原理获得第一阶段的分割结果;然后以超像素为基本分割单元,获得均匀的运动和表现;最后在能量函数中引入信息熵约束项,构建前景背景像素标记的优化问题,通过最小化能量函数得到更精确的分割结果。在公开数据集上的实验结果表明目标模型中引入信息熵约束项能够有效提高视频目标分割的鲁棒性。
    基于三维矫正和相似性学习的无约束人脸验证
    徐昕, 梁久祯
    2018, 38(10):  2788-2793.  DOI: 10.11772/j.issn.1001-9081.2018041068
    摘要 ( )   PDF (1184KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对无约束条件下的人脸图像样本少、面部姿态变化大、被遮挡以及背景复杂等问题,提出一种结合三维人脸矫正与相似性学习相结合的人脸验证算法(sub-SL)。首先,通过三维人脸矫正方法对人脸图像进行姿态矫正,将图像中的人脸矫正为标准正面脸;其次,裁剪该正面脸的脸部相关区域,去除复杂的图像背景;最后,利用基于个体子空间的相似性学习方法对图像对之间的相似度进行度量,完成人脸验证。实验采用了几个以LFW(Labeled Faces in the Wild)数据库为基础的经过预处理操作(例如人脸矫正、裁剪等)后建立起来的数据库。在基于局部三值模式(LTP)的特征提取方法并且训练图像对数为625的实验中,sub-SL算法的识别率比利用马氏距离进行度量学习的算法sub-ML以及结合了马氏距离与相似性学习的度量学习算法sub-SML分别高出了15.6%和8.4%。实验结果表明,sub-SL算法能够有效提高无约束条件下人脸识别的准确率。
    人工智能
    降低相似度碰撞的证据融合方法
    王剑, 张志勇, 乔阔远
    2018, 38(10):  2794-2800.  DOI: 10.11772/j.issn.1001-9081.2018030532
    摘要 ( )   PDF (1010KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对相似度碰撞引发证据融合结果错误的问题,提出一种新的证据融合方法。首先,提取证据的焦元序列特征并将其转化为排序矩阵以弥补证据相似度易碰撞的不足;其次,联合证据的排序矩阵和信息熵完成对证据权重的确定;最后,生成归一化证据(MAE)并使用Dempster融合公式将MAE融合n-1次获得最终的结果。基于在线的鸢尾花数据集对证据平均融合方法、余弦相似度证据融合方法、证据距离融合方法和证据信誉度融合方法进行了花类型识别准确性的F-Score对比,上述四种方法的F-Score分别为0.84、0.88、0.88和0.88,而所提方法的F-Score为0.91。实验结果表明,所提方法的决策准确率更高,融合结果更加可靠,能为证据决策提供了有效的解决方案。

    基于改进模糊熵和证据推理的多属性决策方法
    熊宁欣, 王应明
    2018, 38(10):  2801-2806.  DOI: 10.11772/j.issn.1001-9081.2018030677
    摘要 ( )   PDF (885KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对证据推理方法框架下属性权重难以获取的问题,提出一种基于改进模糊熵和证据推理的多属性决策方法。首先,定义证据推理信度决策矩阵框架下的三角函数模糊熵公式,并证明了其满足熵的四个公理化定义。其次,所提方法能够同时处理属性权重完全未知和属性权重信息部分已知两种情况:当属性权重完全未知时,基于信度框架下的改进模糊熵和熵权法的基本思想计算属性权重;当属性权重信息部分已知时,定义加权模糊熵,建立期望模糊熵最小的线性规划模型求解最优属性权重。最后,利用证据推理算法融合方案属性值,结合期望效用理论得到方案排序结果。通过实例计算,并与传统模糊熵计算方法进行比较分析,验证了所提方法能够更加充分地反映原始决策信息,更具客观性和一般性。
    基于引力模型的多标签分类算法
    李兆玉, 王纪超, 雷曼, 龚琴
    2018, 38(10):  2807-2811.  DOI: 10.11772/j.issn.1001-9081.2018040813
    摘要 ( )   PDF (864KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对多标签分类算法不能充分利用标签相关性的问题,通过建立标签的正、负相关性矩阵来挖掘标签间不同的相关关系,提出一种基于引力模型的多标签分类算法(MLBGM)。首先,遍历训练集中所有样本并分别求取每个训练样本的k个近邻样本,组成该样本的近邻集合;其次,根据每个样本的近邻集合中所有近邻样本的标签分布情况,分别为每个训练样本建立正、负相关矩阵来获取标签间的相关性;然后,为每个训练样本的近邻集合计算其近邻密度和近邻权重;最后,采用计算数据粒子间相互作用力的方式构建多标签分类模型。实验结果显示,MLBGM与5种未考虑标签负相关的对比算法相比,汉明损失(HammingLoss)平均降低了15.62%,微平均F1值(MicroF1)平均提升了7.12%,子集准确率(SubsetAccurary)平均提升了14.88%。MLBGM充分利用了标签间不同的相关性,获得了有效的实验结果且分类效果优于未考虑标签负相关的对比算法。
    基于多变异策略的自适应差分进化算法
    张强, 邹德旋, 耿娜, 沈鑫
    2018, 38(10):  2812-2821.  DOI: 10.11772/j.issn.1001-9081.2018030684
    摘要 ( )   PDF (1379KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了克服差分进化算法寻优精度低、收敛速度慢、稳定性差等不足,提出一种基于多变异策略的自适应差分进化算法(ADE-MM)。首先,在3个变异策略的选择过程中添加2个具有学习功能的扰动阈值,以提高种群多样性,扩大搜索范围;然后,根据上次迭代的成功参数自适应调整当前参数,提高寻优精度和寻优速度;最后,利用向量粒子池法和中心粒子法产生新的向量粒子,进一步提高寻优效果。使用8个函数、5种对比算法(RMDE、OLCPDE、JADE、SaDE、MDE_pBX)进行测试,且每种例子都独立执行30次。ADE-MM算法在均值和方差的比较中取得了全胜,其中在30维的情况下取得了5个独立胜利,3个并列胜利;在50维的情况下取得了6个独立胜利,2个并列胜利;在100维的情况下全部为独立胜利。同时在Wilcoxon rank sum test、胜率和算法耗时分析中,ADE-MM算法也取得优异的表现。实验结果表明,相对于其他5种对比算法,ADE-MM算法具有更强的全局寻优能力、收敛性和稳定性。
    基于概率信息不完备的群决策模型
    戴意瑜, 陈江
    2018, 38(10):  2822-2826.  DOI: 10.11772/j.issn.1001-9081.2018030657
    摘要 ( )   PDF (856KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对犹豫模糊元中元素发生的概率信息不完备的群决策问题,提出一种基于最优化模型和一致性调整算法的群决策模型。该模型首先引入了概率不完备犹豫模糊偏好关系(PIHFPR)、概率不完备犹豫模糊偏好关系的期望一致性以及概率不完备犹豫模糊偏好关系的满意加性期望一致性等概念;其次,以PIHFPR和排序权重向量间的偏差最小化作为目标函数,构建线性最优化模型计算得到PIHFPR中不完备的概率信息;随后,通过提出的加权概率不完备犹豫模糊偏好关系集成算子确定综合的PIHFPR,同时设计一种群体一致性调整算法,不仅使得调整后的PIHFPR具有满意加性期望一致性,还可以计算方案的排序权重。最后,将群决策模型应用于区块链的选择实例中。实验结果表明,决策结果合理可靠,且更能反映实际决策情况。
    改进非线性干扰观测器的机械臂自适应反演滑模控制
    邹思凡, 吴国庆, 茅靖峰, 朱维南, 王玉荣, 王健
    2018, 38(10):  2827-2832.  DOI: 10.11772/j.issn.1001-9081.2018030525
    摘要 ( )   PDF (799KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对传统滑模和传统干扰观测器在机械臂关节位置跟踪中存在的控制输入抖振、需要测量加速度项、应用模型受限等问题,提出一种改进非线性干扰观测器的机械臂自适应反演滑模控制算法。首先,设计改进的非线性干扰观测器进行在线测试,在滑模控制律中加入干扰估计值对可观测的干扰进行补偿;然后选择合适的设计参数,使观测误差指数型收敛;其次,引入反演自适应控制律,对不可观测的干扰进行估计,进一步改善控制系统的跟踪性能;最后,利用李雅普诺夫函数验证了闭环系统的渐近稳定性,并将其应用于机械臂关节位置跟踪。实验结果表明,与传统滑模算法比较,所提控制算法不但加快了系统的响应速度,而且能有效地削弱系统抖振、避免测量加速度项并扩大应用模型使用范围。
    基于转置卷积操作改进的单阶段多边框目标检测方法
    郭川磊, 何嘉
    2018, 38(10):  2833-2838.  DOI: 10.11772/j.issn.1001-9081.2018030720
    摘要 ( )   PDF (984KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对单阶段多边框目标检测(SSD)模型在以高交并比(IoU)评估平均检测精度(mAP)时出现的精度下降问题,提出一种使用转置卷积操作构建的循环特征聚合模型。该模型以SSD模型为基础,使用ResNet 101作为特征提取网络。首先,利用转置卷积操作扩大网络结构中深层特征图的尺寸,为浅层特征图引入对目标的高层抽象和上下文信息;其次,使用全连接卷积层减少浅层特征图在进行特征聚合时出现偏差的可能性;最后,将浅层特征图与表示了上下文信息的深层特征图拼接,并使用1×1卷积操作恢复通道数。特征聚合过程可以循环进行多次。实验结果表明,使用KITTI数据集,以交并比(IoU)为0.7评估平均检测精度,与原始SSD模型相比,循环特征聚合模型的检测精度提高了5.1个百分点;与已有的精度最高Faster R-CNN相比,检测精度提高了2个百分点。循环特征聚合模型能有效提升平均目标检测精度,生成高质量的边界框。
    基于多特征i-vector的短语音说话人识别算法
    孙念, 张毅, 林海波, 黄超
    2018, 38(10):  2839-2843.  DOI: 10.11772/j.issn.1001-9081.2018030598
    摘要 ( )   PDF (731KB) ( )  
    参考文献 | 相关文章 | 计量指标
    当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vector的短语音说话人识别算法。该算法首先提取不同的声学特征向量组合成一个高维特征向量,然后利用主成分分析(PCA)去除高维特征向量的相关性,使特征之间正交化,最后采用线性判别分析(LDA)挑选出最具区分性的特征,并且在一定程度上降低空间维度,从而实现更好的说话人识别性能。结合TIMIT语料库进行实验,同一时长的短语音(2 s)条件下,所提算法比基于i-vector的单一的梅尔频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、感知对数面积比系数(PLAR)特征系统在等错误率(EER)上分别有相对72.16%、69.47%和73.62%的下降。不同时长的短语音条件下,所提算法比基于i-vector的单一特征系统在EER和检测代价函数(DCF)上大致都有50%的降低。基于以上两种实验的结果充分表明了所提算法在短语音说话人识别系统中可以充分提取说话人的个性信息,有利地提高说话人识别性能。
    数据科学与技术
    基于概率模型的非均匀数据聚类算法
    杨天鹏, 陈黎飞
    2018, 38(10):  2844-2849.  DOI: 10.11772/j.issn.1001-9081.2018020375
    摘要 ( )   PDF (1008KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对传统K-means型算法的"均匀效应"问题,提出一种基于概率模型的聚类算法。首先,提出一个描述非均匀数据簇的高斯混合分布模型,该模型允许数据集中同时包含密度和大小存在差异的簇;其次,推导了非均匀数据聚类的目标优化函数,并定义了优化该函数的期望最大化(EM)型聚类算法。分析结果表明,所提算法可以进行非均匀数据的软子空间聚类。最后,在合成数据集与实际数据集上进行的实验结果表明,所提算法有较高的聚类精度,与现有K-means型算法及基于欠抽样的算法相比,所提算法获得了5%~50%的精度提升。
    基于多维网格空间的改进K-means聚类算法
    邵伦, 周新志, 赵成萍, 张旭
    2018, 38(10):  2850-2855.  DOI: 10.11772/j.issn.1001-9081.2018040830
    摘要 ( )   PDF (828KB) ( )  
    参考文献 | 相关文章 | 计量指标
    K-means算法是被广泛使用的一种聚类算法,传统的K-means算法中初始聚类中心的选择具有随机性,易使算法陷入局部最优,聚类结果不稳定。针对此问题,引入多维网格空间的思想,首先将样本集映射到一个虚拟的多维网格空间结构中,然后从中搜索出包含样本数最多且距离较远的子网格作为初始聚类中心网格,最后计算出各初始聚类中心网格中所包含样本的均值点来作为初始聚类中心。此法选择出来的初始聚类中心与实际聚类中心拟合度高,进而可据此初始聚类中心稳定高效地得到最终的聚类结果。通过使用计算机模拟数据集和UCI机器学习数据集进行测试,结果表明改进算法的迭代次数和错误率比较稳定,且均小于传统K-means算法测试结果的平均值,能有效避免陷入局部最优,并且聚类结果稳定。
    基于自步学习的无监督属性选择算法
    龚永红, 郑威, 吴林, 谭马龙, 余浩
    2018, 38(10):  2856-2861.  DOI: 10.11772/j.issn.1001-9081.2018020448
    摘要 ( )   PDF (886KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对现有属性选择算法平等地对待每个样本而忽略样本之间的差异性,从而使学习模型无法避免噪声样本影响问题,提出一种融合自步学习理论的无监督属性选择(UFS-SPL)算法。首先自动选取一个重要的样本子集训练得到属性选择的鲁棒性初始模型,然后逐步自动引入次要样本提升模型的泛化能力,最终获得一个能避免噪声干扰而同时具有鲁棒性和泛化性的属性选择模型。在真实数据集上与凸半监督多标签属性选择(CSFS)、正则化自表达(RSR)和无监督属性选择的耦合字典学习方法(CDLFS)相比,UFS-SPL的聚类准确率、互信息和纯度平均提升12.06%、10.54%和10.5%。实验结果表明,UFS-SPL能够有效降低数据集中无关信息的影响。
    耦合图像间的数据融合算法
    任晓旭, 吕良福, 崔广泰
    2018, 38(10):  2862-2868.  DOI: 10.11772/j.issn.1001-9081.2018020482
    摘要 ( )   PDF (1023KB) ( )  
    参考文献 | 相关文章 | 计量指标
    耦合数据的融合算法主要通过利用其中一个数据集的信息提高对其他耦合数据集的估计精度和完善对相关潜变量的解释。针对现实中存在的大量耦合图像,基于耦合数据融合中的耦合矩阵和张量分解优化(CMTF-OPT)算法,提出一种针对耦合图像的耦合图像分解优化(CIF-OPT)算法。相应的理论分析及实验结果表明,不同噪声影响下用CIF-OPT算法进行耦合图像融合后的效果均具有鲁棒性,且融合效果优于其他耦合算法(如:CMTF-OPT算法)。特别地,针对其中缺失数据元素的图像,CIF-OPT算法可以利用与其耦合的图像,对缺失数据元素的图像进行精确的数据恢复。
    基于Hilbert-R树分级索引的时空查询算法
    侯海耀, 钱育蓉, 英昌甜, 张晗, 卢学远, 赵燚
    2018, 38(10):  2869-2874.  DOI: 10.11772/j.issn.1001-9081.2018040749
    摘要 ( )   PDF (993KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对树形空间索引中多路查询及未考虑时间维索引的问题,提出一种结合时间和聚类结果的Hilbert-R树索引构建策略。首先,按照数据采集的周期划分时空数据集,并在此基础上建立时间索引,通过Hilbert曲线对空间数据进行分割编码,将空间坐标映射到一维区间;其次,依据数据要素在空间中的分布,采用动态确定K值的聚类算法,结合聚类结果构建高效的Hilbert-R树空间索引;最后,基于Redis几种常见的键值数据结构,对时空数据的时间属性和聚类结果构建分级索引。在时空范围及目标矢量对象查询的实验中,与缓存敏感R+树(CCR+)相比,所提算法可有效减少时间开销,查询时间平均缩短约25%,对不同密集型数据具有良好的适应性,可更好地支持Redis应用于海量时空数据查询。
    加权增量关联规则挖掘在通信告警预测中的应用
    王帅, 杨秋辉, 曾嘉彦, 万莹, 樊哲宁, 张光兰
    2018, 38(10):  2875-2880.  DOI: 10.11772/j.issn.1001-9081.2018020392
    摘要 ( )   PDF (926KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对通信网络告警预测中预测精度不高、模型训练效率较低等缺陷,提出告警权值确定方法和基于自然序树(Can-tree)的加权增量关联规则挖掘的通信网络告警预测方案。首先,对告警数据进行预处理,确定告警数据权值并压缩到Can-tree结构中;其次,应用增量关联规则挖掘算法对Can-tree进行挖掘,生成告警关联规则;最后,使用模式匹配的方法对实时告警信息进行预测,并对结果进行优化整理。实验结果表明,基于Can-tree的加权增量关联规则挖掘算法是高效的,利用前次挖掘的结果和信息提高了挖掘的效率,网络告警数据的权值分配方案能够合理地区分告警数据的重要程度,有助于将重要程度高的告警关联规则挖掘出来,并加快过时告警关联规则的淘汰,提高预测的准确度和精度。
    面向电信行业网络告警系统的告警过滤算法
    徐冰珂, 周宇喆, 杨茂林, 谢远航, 李晓瑜, 雷航
    2018, 38(10):  2881-2885.  DOI: 10.11772/j.issn.1001-9081.2018040879
    摘要 ( )   PDF (774KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了减小电信网络中海量告警数据对的告警根源分析所造成的干扰,提出一种告警过滤算法。首先,基于电信网络告警数据对告警量分布、告警持续时间等特征进行量化分析,提出告警影响力和高频瞬态告警概念。在此基础上,从告警量、平均告警时间、告警影响力以及告警实例持续时间四个维度对告警重要程度进行综合分析,并提出复杂度为On)(n为告警记录数)的告警过滤算法。单因素实验分析显示,告警压缩比与特定告警元的告警量、平均告警时间、告警影响力以及告警实例持续时间具有正相关关系。对比实验结果表明,在相似告警压缩比下,所提算法的准确性比FTD(Flexible Transient flapping Determination)算法最多提高18个百分点,可用于电信行业的告警数据样本分析以及在线告警过滤。
    集成用户信任度和品牌认可度的商品推荐方法
    冯勇, 韩晓龙, 付陈平, 王嵘冰, 徐红艳
    2018, 38(10):  2886-2891.  DOI: 10.11772/j.issn.1001-9081.2018040766
    摘要 ( )   PDF (848KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对个性化商品推荐方法中普遍存在的推荐准确率不高的问题,提出一种集成用户信任度和品牌认可度的商品推荐方法(TBCRMI)。该方法通过分析用户的购买行为和评价行为,计算得到用户对商品品牌的认可度和用户自身的活跃度;然后利用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法对用户进行聚类,并在此基础上融合用户信任关系,采用Top-K方法得到近邻关系;最后,依据近邻关系生成目标用户商品推荐列表。为了验证算法的有效性,使用Amazon Food和Unlocked Mobile phone两个数据集,选择基于用户的协同过滤算法(UserCF)、融合用户信任的协同过滤推荐算法(SPTUserCF)与合并用户信任的协同过滤算法(MTUserCF),对准确率、召回率和F1值等指标进行了对比分析。实验结果表明,无论是多品牌综合推荐还是单一品牌推荐,TBCRMI在各项指标均优于目前常用的个性化商品推荐方法。
    网络空间安全
    面向公有云的数据完整性公开审计方案
    缪俊敏, 冯朝胜, 李敏, 刘霞
    2018, 38(10):  2892-2898.  DOI: 10.11772/j.issn.1001-9081.2018030510
    摘要 ( )   PDF (1067KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对云数据完整性公开审计中隐私泄漏给第三方审计者(TPA)以及云存储服务器(CSS)发起替代攻击的问题,提出一种面向公有云的数据完整性公开审计方案。该方案首先利用哈希值混淆方法,模糊化云存储服务器返回的证据,以防止TPA分析证据计算出原始数据;然后,在审计过程中,由TPA自行计算出文件Merkle哈希树(MHT)对应挑战请求所选数据块的覆盖树,并与CSS返回的覆盖树作结构匹配,以防止云存储服务器用其他已有数据响应审计挑战。实验结果表明,该方案解决了现有方案隐私问题及攻击问题后,在计算开销、存储开销和通信开销方面的性能不会有数量级变化。
    考虑社交网络用户行为的网络病毒传播建模
    冯丽萍, 韩燮, 韩琦, 郑芳
    2018, 38(10):  2899-2902.  DOI: 10.11772/j.issn.1001-9081.2018040850
    摘要 ( )   PDF (761KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对已有病毒传播模型都没有考虑不同社交网络间的用户交互行为对网络病毒传播规律的影响,建立了考虑不同社交网络用户交互行为的微分方程动力学模型。利用稳定性理论分析了模型反映的网络病毒传播动力学性态,得到了控制网络病毒传播的基本再生数的精确数学表达式。进一步,采用龙格-库塔数值方法,通过仿真实验,验证了理论分析的正确性。研究结果表明,基本再生数是网络病毒扩散基本态势的直接决定因素,当基本再生数的值小于等于1时,随着时间演化,网络病毒的扩散会被彻底控制。另外还发现,分散用户到不同社交网络更有利于缓解网络病毒的扩散。
    基于混合卷积神经网络和循环神经网络的入侵检测模型
    方圆, 李明, 王萍, 江兴何, 张信明
    2018, 38(10):  2903-2907.  DOI: 10.11772/j.issn.1001-9081.2018030710
    摘要 ( )   PDF (918KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对电力信息网络中的高级持续性威胁问题,提出一种基于混合卷积神经网络(CNN)和循环神经网络(RNN)的入侵检测模型。该模型根据网络数据流量的统计特征对当前网络状态进行分类。首先,获取日志文件中网络流量的各统计值,进行特征编码、归一化等预处理工作;然后,通过深度卷积神经网络中可变卷积核提取不同主机入侵流量之间空间相关特征;最后,将已经处理好的包含空间相关特征的数据在时间上错开排列,利用深度循环神经网络挖掘入侵流量的时间相关特征。实验结果表明,该模型相对于传统的机器学习模型在曲线下方的面积(AUC)上提升了7.5%~14.0%,同时误报率降低了83.7%~52.7%。所提模型能准确地识别网络流量的类别,大幅降低误报率。
    基于机会式中继传输策略的安全性能分析
    张勇建, 贺玉成, 周林
    2018, 38(10):  2908-2912.  DOI: 10.11772/j.issn.1001-9081.2018030665
    摘要 ( )   PDF (835KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对无线通信过程中信息被非法用户窃听的问题,提出一种基于最佳中继选择的安全传输策略。首先,在源节点处整合了预先设计的人工噪声与有用信息,通过最佳中继选择算法选择最佳中继对接收到的信息进行转发;其次,推导出系统的安全容量、中断概率以及拦截概率;最后,利用安全性与可靠性折中的性能来确定最佳的中继个数。理论分析和实验仿真结果表明,与传统没有加入人工噪声的系统模型相比,该系统的性能提升可以明显通过增加中继节点来实现。
    全双工无线供能物联网的物理层安全性能分析
    刘铭, 毛玉明, 冷甦鹏
    2018, 38(10):  2913-2917.  DOI: 10.11772/j.issn.1001-9081.2018030725
    摘要 ( )   PDF (786KB) ( )  
    参考文献 | 相关文章 | 计量指标
    面对干扰和窃听,传统的安全信息传输大都基于密钥加密的方法,在面向动态变化无线网络环境时会产生对称性密码系统的密钥分配、非对称性密码系统的高计算复杂度等问题。而快速增长的无线业务流量和物联网类型的海量设备接入,会引起计算复杂度的进一步提升和能量开销的激增。针对此问题,提出一种基于物理层安全技术的全双工无线供能物联网的安全通信方法,利用噪声和无线信道随机性来限制窃听者接收信息量。该方法首先基于信息论对全双工无线供能物联网安全容量进行分析,然后根据安全容量的分析模型推导得到了安全中断概率(SOP)的闭合表达式。最后,考虑到噪声、干扰机干扰、空间互干扰,以及残余自干扰等因素对安全容量的影响,提出一种全双工无线供能物联网安全波束成形方法,该方法通过降低联合干扰来增加发送和接收端的互信息量,提高全双工无线功能物联网的安全容量。通过蒙特卡罗仿真验证了推导结果的准确性,仿真结果表明,在安全容量和SOP指标上,全双工无线供能物联网比传统半双工无线功能物联网有较大性能增益。
    基于差分隐私保护的谱聚类算法
    郑孝遥, 陈冬梅, 刘雨晴, 尤浩, 汪祥舜, 孙丽萍
    2018, 38(10):  2918-2922.  DOI: 10.11772/j.issn.1001-9081.2018040888
    摘要 ( )   PDF (753KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对传统的聚类算法存在隐私泄露的风险,提出一种基于差分隐私保护的谱聚类算法。该算法基于差分隐私模型,利用累计分布函数生成满足拉普拉斯分布的随机噪声,将该噪声添加到经过谱聚类算法计算的样本相似度的函数中,干扰样本个体之间的权重值,实现样本个体间的信息隐藏以达到隐私保护的目的。通过UCI数据集上的仿真实验,表明该算法能够在一定的信息损失度范围内实现有效的数据聚类,也可以对聚类数据进行保护。
    基于生成对抗网络的信息隐藏方案
    王耀杰, 钮可, 杨晓元
    2018, 38(10):  2923-2928.  DOI: 10.11772/j.issn.1001-9081.2018030666
    摘要 ( )   PDF (882KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对信息隐藏中含密载体会留有修改痕迹,从根本上难以抵抗基于统计的隐写分析算法检测的问题,提出一种基于生成对抗网络(GAN)的信息隐藏方案。该方案首先利用生成对抗网络中的生成模型G以噪声为驱动生成原始载体信息;其次,使用±1嵌入算法,将秘密消息嵌入到生成的载体信息中生成含密信息;最终,将含密信息与真实图像样本作为生成对抗网络中判别模型D的输入,进行迭代优化,同时使用判别模型S来检测图像是否存在隐写操作,反馈生成图像质量的特性,G&D&S三者在迭代过程中相互竞争,性能不断提高。该方案所采用的策略与SGAN(Steganographic GAN)和SSGAN(Secure Steganography based on GAN)两种方案不同,主要区别是将含密信息与真实图像样本作为判别模型的输入,对于判别网络D进行重构,使网络更好地评估生成图像的性能。与SGAN和SSGAN相比,该方案使得攻击者在隐写分析正确性上分别降低了13.1%和6.4%。实验结果表明,新的信息隐藏方案通过生成更合适的载体信息来保证信息隐藏的安全性,能够有效抵抗隐写算法的检测,在抗隐写分析和安全性指标上明显优于对比方案。
    基于图像纹理和卷积神经网络的恶意文件检测方法
    蒋晨, 胡玉鹏, 司凯, 旷文鑫
    2018, 38(10):  2929-2933.  DOI: 10.11772/j.issn.1001-9081.2018030691
    摘要 ( )   PDF (716KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在大数据环境下,针对传统恶意文件检测方法对经过代码变种和混淆后的恶意文件检测准确率低以及对跨平台恶意文件检测通用性弱等问题,提出一种基于图像纹理和卷积神经网络的恶意文件检测方法。首先,使用灰度图像生成算法将Android和Windows平台下可执行文件,即.dex和.exe文件,转换成相应的灰度图像;然后,通过卷积神经网络(CNN)算法自动提取这些灰度图像的纹理特征并加以学习训练,从而构建出一个恶意文件检测模型;最后,使用大量未知待检测的文件去验证模型检测准确率的高低。通过对大量的恶意样本进行实验,在Android和Windows平台下,模型检测最高准确率分别达到79.6%和97.6%,平均准确率分别约为79.3%和96.8%;与基于纹理指纹的恶意代码变种检测方法相比,基于图像纹理和卷积神经网络的恶意文件检测方法准确率提高了约20%。实验结果表明,所提方法能够有效避免人工筛选特征带来的问题,大幅提高检测的准确率和效率,成功解决跨平台检测问题,实现了一种端到端的恶意文件检测模型。
    新的低轮Keccak线性结构设计
    刘晓强, 韦永壮, 刘争红
    2018, 38(10):  2934-2939.  DOI: 10.11772/j.issn.1001-9081.2018030617
    摘要 ( )   PDF (913KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对Keccak算法S盒层线性分解的问题,提出一种新的线性结构构造方法,该方法主要基于Keccak算法S盒代数性质。首先,S盒层的输入比特需要固定部分约束条件,以确保状态数据经过这种线性结构仍具有线性关系;然后再结合中间相遇攻击的思想给出新的低轮Keccak算法零和区分器的构造方法。实验结果表明:新的顺1轮、逆1轮零和区分器可以完成目前理论上最好的15轮Keccak的区分攻击,且复杂度降低至2257;新的顺1轮、逆2轮零和区分器具有自由变量更多、区分攻击的组合方式更丰富等优点。
    基于混沌映射的多因子认证密钥协商协议
    王松伟, 陈建华
    2018, 38(10):  2940-2944.  DOI: 10.11772/j.issn.1001-9081.2018030642
    摘要 ( )   PDF (877KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在开放的网络环境中,身份认证是确保信息安全的一种重要手段。针对Li等(LI X,WU F,KHAN M K,et al.A secure chaotic map-based remote authentication scheme for telecare medicine information systems.Future Generation Computer Systems,2017,84:149-159.)提出的身份认证协议,指出其容易遭受用户冒充攻击、拒绝服务攻击等缺陷,并提出一个新的多因子认证协议来修复以上安全漏洞。该协议使用了扩展混沌映射,采用动态身份保护用户匿名性,并利用三次握手技术实现异步认证。安全性分析结果表明,所提协议可以抵抗冒充攻击、拒绝服务攻击,能够保护用户匿名性和身份唯一性。
    网络与通信
    LTE-A空口监测分析仪中PDSCH解资源映射的设计与实现
    王美乐, 张治中, 王光亚
    2018, 38(10):  2945-2949.  DOI: 10.11772/j.issn.1001-9081.2018030518
    摘要 ( )   PDF (762KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对增强型长期演进(LTE-A)物理层传统解资源映射方法中重复计算资源映射位置造成的计算量冗余问题,提出一种新型架构的物理下行共享信道(PDSCH)解资源映射方法,为LTE-A空口监测分析仪相关物理层处理提供支持。首先,在物理层下行信号和信道解资源映射之前,产生单天线端口0模式、发射分集模式、单流波束赋形以及双流波束赋形下各个信号和信道的资源索引;然后,在物理层解资源映射时根据资源索引直接定位各信号和信道资源的时频位置;最后,把PDSCH信道解资源映射模块放在整个LTE-A链路级仿真平台中,给出四种传输模式下的仿真,得出不同传输模式下的误码率以及吞吐量的对比图,为最终的硬件实现提供理论参考。同时通过与传统架构下的解资源映射模块进行对比表明,该新型架构下的解资源映射模块比传统架构下的解资源映射仿真所花费的时间减少了33.33%,降低了解资源映射时的运算量和设备资源消耗。
    空间调制系统下改进的QRD-M检测算法
    周围, 郭梦雨, 向丹蕾
    2018, 38(10):  2950-2954.  DOI: 10.11772/j.issn.1001-9081.2018030721
    摘要 ( )   PDF (781KB) ( )  
    参考文献 | 相关文章 | 计量指标
    空间调制(SM)系统中性能最优的最大似然(ML)检测算法复杂度很高,用基于信道矩阵QR分解的M算法(QRD-M)可以降低复杂度,但传统QRD-M算法检测时,每层都保留固定的M个节点,仍会造成额外的计算量。针对传统QRD-M算法中存在的问题,提出一种低复杂度的动态M值QRD-M检测算法——LC-QRD-dM。LC-QRD-dM算法利用设计的阈值与累积分支度量值进行比较,每层自适应地选择不超过M的保留节点数,相对于传统QRD-M算法以牺牲少量性能为代价大大降低了复杂度。接着又针对该改进算法在信道衰落较深时会产生较大误码率的问题,进一步提出一种基于信道状态的动态M值QRD-M检测算法——CS-QRD-dM。CS-QRD-dM利用LC-QRD-dM的原理,在低信噪比(SNR)时,每层根据阈值选择不小于M的保留节点数;在高信噪比时,每层则选择不超过M的保留节点数。理论分析和仿真结果表明:相比传统QRD-M,CS-QRD-dM在低信噪比时有约1.3 dB的信噪比增益(误码率为10-2),以增加少量复杂度为代价,显著地改善了检测性能;在高信噪比时,其检测性能及复杂度与LC-QRD-dM相同。
    联合信道非相干网络编码调制方法
    高枫越, 王琰, 李牧, 于睿
    2018, 38(10):  2955-2959.  DOI: 10.11772/j.issn.1001-9081.2018030591
    摘要 ( )   PDF (894KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对时变双向中继信道下的物理层网络编码问题,提出多天线场景下不需要信道状态信息的联合信道编码的非相干物理层网络编码调制和检测方法。首先,为了实现物理层网络编码,设计了源节点的空间调制矩阵。然后,将差分空间调制与物理层网络编码结合,推导得到中继节点处叠加信号的最大后验概率检测表达式。同时,结合叠加信号的星座图,设计从叠加星座到中继转发符号的映射方案。最后,利用信道编码的线形结构,结合比特交织、信道译码与软入软出检测算法,进而得到联合信道-差分物理层网络编码迭代检测方法。仿真结果表明,所提方法能在双向中继场景下实现物理层网络编码的非相干传输与检测,有效提高了系统的吞吐量和频谱效率。
    基于质量可伸缩高性能视频编码的帧内快速算法
    刘妍君, 赵志强, 刘艳, 崔盈, 汪大勇, 冉鹏, 郭毅军
    2018, 38(10):  2960-2964.  DOI: 10.11772/j.issn.1001-9081.2018010162
    摘要 ( )   PDF (786KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了提高质量可伸缩高性能视频编码(SHVC)的编码速度,提出一种基于质量SHVC的帧内预测算法。首先,利用层间相关性来预测可能的深度,排除可能性较小的深度;其次,对可能的编码深度,采用层间预测(ILR)模式进行编码,并对得到的残差系数进行分布拟合检验,判断是否满足拉普拉斯分布从而跳过帧内模式;最后,对深度编码得到的深度残差系数判断是否满足深度提前终止判断条件,如果满足该条件则提前终止以提高编码速度。实验结果表明,所提算法能够在保证编码效率损失很小的情况下使编码速度提高79%。
    中继蜂窝网络能量效率分析
    陈永红, 郭莉莉, 张士兵
    2018, 38(10):  2965-2970.  DOI: 10.11772/j.issn.1001-9081.2018030628
    摘要 ( )   PDF (801KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对宏基站采用单天线技术的中继蜂窝网络能量效率较低的问题,研究宏基站采用多天线技术的中继辅助蜂窝网络的下行传输系统,提出中继采用策略休眠方案。首先根据中继服务的用户数是否超过给定阈值,动态调整中继的工作模式;然后推导出宏基站到用户、宏基站到中继及中继到用户链路的覆盖概率和平均可达速率;最后根据单位面积功耗和单位面积可达速率推导出系统的能量效率。仿真结果表明,当宏基站密度为2×10-5m-2时,采用休眠策略的多天线网络的能量效率比没有采用休眠策略的网络的能量效率提高约为5.6%;宏基站采用多天线和采用单天线相比,系统能量效率提高了30%。实验结果表明,多天线中继策略休眠蜂窝网络比单天线中继辅助蜂窝网络具有更高的能量效率。
    聚类系数和度相关性均可调的HK扩展模型
    周玉江, 王娟
    2018, 38(10):  2971-2975.  DOI: 10.11772/j.issn.1001-9081.2018030592
    摘要 ( )   PDF (736KB) ( )  
    参考文献 | 相关文章 | 计量指标
    现有的社交网络增长演化模型的度相关性大多为负值。针对这种情况,以HK(Holme和Kim)模型为基础,考虑社交网络中度的正相关特性以及高聚类系数的特征,提出一种适用于构造社交网络的演化增长模型。首先,对现实中的社交网络拓扑结构进行分析,获取真实社交网络的一些重要拓扑参数;然后,通过引入改进的三角连接机制,对HK模型进行改进以实现网络的聚类系数和相关性均可调的目的,称其为聚类系数和度相关性均可调的HK扩展模型(HK-TDC&C),通过该模型可以构造各种拓扑结构的网络。最后,利用平均场理论对该模型的度分布进行分析,并采用Matlab进行数值仿真,计算网络的其他拓扑参数。实验结果表明:通过调节择优参数和连接概率,用HK-TDC&C构造的社交网络可以满足社交网络的基本特性:无标度特性、小世界特性、高聚类系数特性、度正相关特性,其拓扑结构更接近真实社交网络。
    基于改进权重的D-S证据理论的动态负载平衡算法
    邰滢滢, 庞影, 段苛苛, 付云鹏
    2018, 38(10):  2976-2981.  DOI: 10.11772/j.issn.1001-9081.2018030548
    摘要 ( )   PDF (1130KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对大型网络游戏中易出现的服务器集群负载不均衡的问题,提出基于改进权重的D-S(Dempster和Shafer)证据理论的负载平衡判别策略。首先,根据D-S证据理论,将影响服务器性能的多因素作为判据,利用历史数据与阈值大小的比较规则计算动态权重,再依据动态权重与原始信度的关系建立基本信任函数;然后,计算不同判据对应结果的信任函数,使用证据合成规则作深层融合;最后分析合成结果,最终推断服务器是否超载。模拟实验结果表明,与基于负反馈机制的动态均衡算法相比,所提算法的准确率更高,更符合真实情况;且所提算法的运行时间明显少于基于负反馈机制的动态均衡算法以及加权循环算法。实验结果表明,新算法有效缩短了运行判断的延迟,能够根据历史参数对当前服务器负载情况快速作出推断,且决策结果可信度高,更符合实际情况。
    基于负载牵引和记忆效应的X参数的功放建模
    南敬昌, 樊爽, 高明明
    2018, 38(10):  2982-2989.  DOI: 10.11772/j.issn.1001-9081.2018010029
    摘要 ( )   PDF (1140KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了更加快速准确地描述带有记忆效应的射频功率放大器,基于传统的X参数模型,结合负载牵引和功放的记忆效应,提出一种新型X参数功放建模方法。新方案首先引入负载反射系数;然后利用双记忆路径模型提取出表征记忆效应的非线性函数替换核函数,采用幅度、负载反射系数与频率三变量作为输出信号的新型前馈(FF)结构建立X参数模型;最后采用阶跃信号代替原始的双音信号提取模型用以达到简化模型提取方法的目的,进而提高模型提取的可行性。经仿真测试CGH40045F功放的数据,利用提出的新型X参数建模方案对功放进行建模,仿真功放的相对误差与传统X参数模型、FF结构X参数模型、FB结构X参数模型相比,均有所减小;与FF结构模型和反馈(FB)结构模型相比,仿真时间分别减少了4.08 s和1.64 s。实验结果表明,该模型能够更加快速有效地拟合带有非线性记忆效应的射频功率放大器。
    计算机软件技术
    基于证据自动机的软件回归验证
    贾尚坤, 贺飞
    2018, 38(10):  2990-2995.  DOI: 10.11772/j.issn.1001-9081.2018030733
    摘要 ( )   PDF (1103KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了在多版本程序验证中利用邻近版本之间的共享信息,提取并重用之前版本证据自动机中的循环不变式,提出基于证据自动机的软件回归验证。首先通过证据预处理生成适用于新版程序的证据文件,然后在辅助不变式增强的k-归纳方法的基础上实现了检验新证据文件及验证新版程序的回归验证过程,最后通过对比实验比较了不使用不变式信息的直接验证与结合或不结合数据流分析的三种回归验证的验证性能。与直接验证相比,不结合与结合数据流分析的回归验证的验证耗时分别减少了49%与75%,而内存消耗分别减少了18%与50%。实验结果表明,当程序满足其验证属性时,基于证据自动机的回归验证能极大地提高验证效率,而将证据自动机与数据流分析相结合的验证方式能得到更好的验证效果。
    基于版本控制的中文文档到源代码的自动跟踪方法
    沈力, 刘洪星, 李勇华
    2018, 38(10):  2996-3001.  DOI: 10.11772/j.issn.1001-9081.2018020302
    摘要 ( )   PDF (915KB) ( )  
    参考文献 | 相关文章 | 计量指标
    软件文档和源代码之间的可追踪性研究广泛使用了信息检索(IR)技术,但由于中文文档和源代码用不同的语言书写,使用传统IR技术进行自动跟踪时会导致精度不高。针对上述问题,提出一种基于版本控制的中文文档到源代码的自动跟踪方法。首先,结合文本到源代码的启发式规则,采用IR方法计算出文本和源代码之间的相似度得分;然后,使用软件开发和维护过程中提交到版本控制软件的更新信息来修正该分数;最后,根据设定的阈值确定中文文档与源代码之间的跟踪关系。实验结果表明,改进方法的精确度和召回率相比传统IR方法均有一定的提高,并且该方法能提取出传统IR方法中遗漏的跟踪关系。
    虚拟现实与多媒体计算
    基于群体Parrondo博弈的根分枝建模方法
    李松阳, 高继勋, 王淼, 刘晓东, 余文奇
    2018, 38(10):  3002-3005.  DOI: 10.11772/j.issn.1001-9081.2018030637
    摘要 ( )   PDF (755KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对采用序列模型实现根分枝建模中不能实现根分枝可塑性的问题,提出一种基于群体Parrondo博弈的根分枝仿真方法,用于异质根系生长环境下根分枝可塑性建模。该方法首先通过构建根原基为个体的根原基群体,然后采用Parrondo博弈实现环境影响下根原基群体间的交互,最后依据根原基群体交互结果,实现根原基个体中生长素更新,从而对根分枝过程实现建模。在四种不同的根系生长环境中实现了对根原基发展成根分枝概率的预测。通过与RootMap等其他根分枝建模方法相比的仿真结果表明,所提方法能够依据根系生长环境中资源空间和时间变化,实现对根原基发展为根分枝过程的建模,从而为根系建模与仿真研究提供模型支撑和分析手段。
    NSCT域内结合相位一致性激励PCNN的多聚焦图像融合
    刘栋, 周冬明, 聂仁灿, 侯瑞超
    2018, 38(10):  3006-3012.  DOI: 10.11772/j.issn.1001-9081.2018040885
    摘要 ( )   PDF (991KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对传统脉冲耦合神经网络(PCNN)无法准确提取多聚焦图像聚焦区域的问题,提出一种利用相位一致性(PC)来检测图像清晰区域,并结合PCNN的多聚焦图像融合算法。首先,利用非下采样轮廓波变换(NSCT)对源图像进行多尺度分解,分别得到图像的高频子带和低频子带;其次,通过计算高频系数的空间频率值(SF)与低频系数的相位一致性值来提取图像高低频子带中的聚焦区域;然后,将SF与PC作为PCNN外部激励来刺激PCNN神经元点火,分别对图像高低频系数进行融合;最后,利用逆NSCT得到最终融合图像。实验采取多聚焦图像Clock、Pepsi和Lab作为三组实验数据集,与传统融合算法及新近提出的几种算法进行对比,所提算法的客观评价参数:互信息、边缘信息度、信息熵、标准差和平均梯度的数值均大于或十分接近于对比算法的最大值;同时从实验结果图与源图像的差值图中可以发现所提算法的差值图包含源图像清晰区域的痕迹明显更少。实验结果表明所提算法能更加准确地提取出图像的清晰区域,更好地保留图像的边缘与纹理等细节信息,得到更好的融合效果。
    基于数字图像处理的眼球控制精度提高方法
    严德赛, 曾诚
    2018, 38(10):  3013-3016.  DOI: 10.11772/j.issn.1001-9081.2018040778
    摘要 ( )   PDF (661KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为提高眼球控制方法的精度,完成对手机或电脑屏幕高准确性的操作,利用人眼看屏幕的焦点和视网膜成像点确定的直线正好通过瞳孔的圆心处,且屏幕的发光轮廓在眼球上反射形成矩形轮廓的原理,提出基于数字图像处理的眼球控制精度提高方法。瞳孔圆心和矩形轮廓之间映射的关系就是人眼焦点在屏幕上的具体位置。通过高清摄像机对眼球进行实时录像,运用数字图像处理技术对每一帧图片进行实时分析处理运算得到人眼焦点在屏幕上的位置坐标,将每一帧图片计算所得坐标输出到鼠标光标上实现对眼球焦点的追踪,将坐标位置信息通过无线技术传输到带有屏幕的被控制设备以实现眼球对其控制。仿真表明,映射方法使眼球控制精度平均准确值达到0.7°。
    应用前沿、交叉与综合
    复杂产品协同设计中数据建模与驱动方法
    殷学梅, 周军华, 朱耀琴
    2018, 38(10):  3017-3024.  DOI: 10.11772/j.issn.1001-9081.2018030614
    摘要 ( )   PDF (1249KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对在传统基于工作流的协同设计中,不同专业设计人员交流和任务协调困难导致产品设计效率低下的问题,提出复杂产品"一元三层"数据模型和基于数据驱动的复杂产品协同设计技术。首先采用多维多粒度的数据建模和本体描述方法完成了对复杂产品的信息建模,然后采用基于本体的语义检索技术完成协同设计过程任务的数据订阅,最后实现基于数据订阅/发布的复杂产品任务协同技术。实验结果表明,基于数据驱动的复杂产品协同设计技术解决了传统协同设计过程中不同专业设计人员之间交流与任务协调的困难,实现复杂产品协同设计过程的螺旋式上升,从而提高了产品设计效率。
    基于信号配时的公交优先策略触发概率模型
    黄海南, 李晓峰, 连培昆, 荣建
    2018, 38(10):  3025-3029.  DOI: 10.11772/j.issn.1001-9081.2018030640
    摘要 ( )   PDF (741KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对现有信号机控制逻辑无法响应公交车辆累积数、控制参数敏感性较低等问题,构建公交优先策略触发概率模型用以检测并分析提高触发精度的方法。首先,依托西门子2070信号机,分析其公交优先策略触发原理,进而构建了绿灯延长策略和红灯早断策略的触发概率模型。然后,以实际交叉口为例,通过硬件在环仿真计算并对比不同信号配时方案的触发概率,探索了公交优先策略触发概率的优化方法。研究结果表明:绿灯延长策略的触发概率远低于红灯早断策略;绿灯延长策略的触发概率与绿灯时间阈值成反比,红灯早断策略的触发概率主要与非优先相位申请优先的公交数量相关;可通过优化最小和最大绿灯时间,及增加申请优先的公交数量提高绿灯延长策略的触发概率;可通过先优化固定信号配时再进行公交优先信号设置等措施提高红灯早断策略的触发概率。
    基于改进人工鱼群算法的车辆轨迹规划方法
    袁娜, 史昕, 赵祥模
    2018, 38(10):  3030-3035.  DOI: 10.11772/j.issn.1001-9081.2018030695
    摘要 ( )   PDF (1011KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对车联网环境下若干典型车辆轨迹规划方法存在车速与轨迹波动性较大的问题,提出一种基于改进人工鱼群算法的车辆轨迹规划方法。该方法以短程通信(DSRC)的车联网应用场景为设计平台,以车辆的最优行车速度为核心计算基础,分析得到了车辆的最佳轨迹。首先,对人工鱼群算法在车联网应用场景的优势和不足进行分析,引入万有引力力学模型与避障模式控制,提出一种改进的人工鱼群算法;然后,分析车辆在车联网应用场景中的受力约束,利用网联车辆的自组织行为控制策略推导最优行车速度;最后,基于最优行车速度实现对车辆的实时轨迹诱导和轨迹避障控制规划。仿真测试结果表明,在运用了基于改进人工鱼群算法的轨迹规划模型后,车辆的驾驶速度更加平稳,轨迹波动性较小,对障碍物可实现零失误避撞;在多车相遇情况下,测试车辆为2~40时,相对于原人工鱼群算法和萤火虫算法,运用改进人工鱼群算法后车速的平均迭代次数减少,迭代效率提高3~7、4~8倍,且随着车辆数目越多,迭代效率提升越明显。
    长期车辆合乘问题的复合变邻域搜索算法
    郭羽含, 伊鹏
    2018, 38(10):  3036-3041.  DOI: 10.11772/j.issn.1001-9081.2018020343
    摘要 ( )   PDF (1021KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对于长期车辆合乘问题(LTCPP),提出一种复合变邻域搜索算法(HVNSA),将具有相同目的地的用户进行合乘匹配从而减少车辆出行数量。首先,构建一个全面准确的长期车辆合乘问题的数学模型,将所有用户按复合距离优先算法分配到合乘小组中,对时间窗口和车容量约束验证,得到初始合乘方案;然后利用变邻域搜索算法对初始合乘方案进行优化迭代,得到最终的优化合乘方案。实验结果表明,该算法在处理100人和200人的规模问题上可以在1 s内得到高质量的优化合乘方案,对于400人和1000人的较大规模问题,该算法仍然可以在2~4 s内得到较高质量的优化合乘方案。
    基于TF-IDF算法的P2P贷款违约预测模型
    章宁, 陈钦
    2018, 38(10):  3042-3047.  DOI: 10.11772/j.issn.1001-9081.2018030673
    摘要 ( )   PDF (887KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前P2P贷款违约预测模型受限于借贷双方信息不对称性,未考虑投资人之间差异性的问题,提出了基于信息检索词频-逆文本频率(TF-IDF)算法的P2P贷款违约预测模型。首先以投资效用理论为基础,利用投资人历史投资收益率、贷款利率出价等信息,建立基于投资人效用的贷款违约预测模型;然后,借鉴信息检索TF-IDF算法,构造投资人逆向投资比例因子,对投资人差异性进行量化度量,优化模型中投资人权重计算因子。实验结果表明,该模型预测准确度与其他模型相比平均提高了6%左右,并在不同的测试数据集上都保持最优。
    基于扩展的低阶多元广义线性模型的脑节点识别方法
    杨雅倩, 唐绍婷
    2018, 38(10):  3048-3052.  DOI: 10.11772/j.issn.1001-9081.2018020432
    摘要 ( )   PDF (764KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对现有单节点模型识别准确度较低以及低阶多元广义线性模型(LRMGLM)计算时间过长和使用局限性问题,提出基于扩展的低阶多元广义线性模型(ELRMGLM)的脑节点识别方法。首先,建立可以同时处理两次实验所有节点数据的ELRMGLM,以更多的时间空间信息来提高算法的准确度;然后,利用带时空平滑惩罚项的优化函数引入先验信息,并通过迭代函数对模型参数进行求解;最后,使用基于K-means的快速选择策略实现惩罚参数和大脑节点的快速选择。三次样本实验中,ELRMGLM的准确度分别比经典血液动力学响应函数(canonical)方法、平滑有限脉冲响应(SFIR)方法、正则化和广义交叉验证(Tik-GCV)方法的最优结果提升了约20%、8%、20%,略优于LRMGLM,且计算时间是LRMGLM的1/750。实验结果表明,ELRMGLM能有效提高大脑节点的识别准确度,减少计算时间。
2022年 42卷 8期
刊出日期: 2022-08-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会