当期目录

    2017年 第37卷 第3期 刊出日期:2017-03-10
    第四届大数据学术会议(CCF BIGDATA2016)
    基于纠删码的细粒度云存储调度方案
    廖辉, 薛广涛, 钱诗友, 李明禄
    2017, 37(3):  613-619.  DOI: 10.11772/j.issn.1001-9081.2017.03.613
    摘要 ( )   PDF (1208KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对云存储系统中数据获取时延长以及数据下载不稳定的问题,提出了一种基于存储节点负载信息和纠删码技术的调度方案。首先,利用纠删码对文件进行编码存储以降低每份数据拷贝的大小,同时利用多个线程并发下载以提高数据获取的速度;其次,通过分析大量存储节点的负载信息确定影响时延的性能指标并对现有的云存储系统架构进行优化,设计了一种基于负载信息的云存储调度算法LOAD-ALGORITHM;最后,利用开源项目OpenStack搭建了一个云计算平台,根据真实的用户请求数据在云平台上进行部署和测试。实验结果表明,相比于现有的工作,调度算法在数据获取时延方面最高能减少15%的平均时延,在数据下载稳定性方面最高能降低40%的时延波动。该调度方案在真实的云平台环境下能有效地提高数据获取速度和稳定性,降低数据获取时延,达到更好的用户体验。
    大数据环境下的分布式数据流处理关键技术探析
    陈付梅, 韩德志, 毕坤, 戴永涛
    2017, 37(3):  620-627.  DOI: 10.11772/j.issn.1001-9081.2017.03.620
    摘要 ( )   PDF (1326KB) ( )  
    参考文献 | 相关文章 | 计量指标
    大数据环境下的数据流处理实时性要求高,数据计算要求持续性和高可靠性。分布式数据流处理系统(DDSPS)能解决大数据环境下的数据流处理问题,它除具备分布式系统的可扩展性和容错性优势外,还具有高的实时处理能力。详细介绍了组成基于大数据的分布式数据流处理系统的四个子系统及其关键技术,讨论和比较了各个子系统的不同技术方案;同时介绍一种分布式拒绝服务(DDoS)攻击检测数据流处理系统结构案例,其研究内容能为大数据环境下的数据流处理理论研究和应用技术开发提供技术参考。
    以LDA为例的大规模分布式机器学习系统分析
    唐黎哲, 冯大为, 李东升, 李荣春, 刘锋
    2017, 37(3):  628-634.  DOI: 10.11772/j.issn.1001-9081.2017.03.628
    摘要 ( )   PDF (1169KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对构建大规模机器学习系统在可扩展性、算法收敛性能、运行效率等方面面临的问题,分析了大规模样本、模型和网络通信给机器学习系统带来的挑战和现有系统的应对方案。以隐含狄利克雷分布(LDA)模型为例,通过对比三款开源分布式LDA系统——Spark LDA、PLDA+和LightLDA,在系统资源消耗、算法收敛性能和可扩展性等方面的表现,分析各系统在设计、实现和性能上的差异。实验结果表明:面对小规模的样本集和模型,LightLDA与PLDA+的内存使用量约为Spark LDA的一半,系统收敛速度为Spark LDA的4至5倍;面对较大规模的样本集和模型,LightLDA的网络通信总量与系统收敛时间远小于PLDA+与SparkLDA,展现出良好的可扩展性。“数据并行+模型并行”的体系结构能有效应对大规模样本和模型的挑战;参数弱同步策略(SSP)、模型本地缓存机制和参数稀疏存储能有效降低网络开销,提升系统运行效率。
    深层次分类中候选类别搜索算法
    张忠林, 刘述昌, 江粉桃
    2017, 37(3):  635-639.  DOI: 10.11772/j.issn.1001-9081.2017.03.635
    摘要 ( )   PDF (968KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对深层次分类中分类准确率低、处理速度慢等问题,提出一种待分类文本的候选类别搜索算法。首先,引入搜索、分类两阶段的处理思想,结合类别层次树的结构特点和类别间的相关联系等隐含的领域知识,进行了类别层次权重分析和特征项的动态更新,为类树层次结构的各个节点构建更具分类判断力的特征项集合;进而,采用深度优先搜索算法并结合设定阈值的剪枝策略缩小搜索范围,搜索得到待分类文本的最优候选类别;最后,在候选类别的基础上应用经典的K最近邻(KNN)分类算法和支持向量机(SVM)分类算法进行分类测试和对比分析。实验结果显示,所提算法的总体分类性能优于传统的分类算法,而且使平均F1值较基于贪心策略的启发式搜索算法提高了6%左右。该算法显著提高了深层次文本分类的分类准确度。
    利用CUR矩阵分解提高特征选择与矩阵恢复能力
    雷恒鑫, 刘惊雷
    2017, 37(3):  640-646.  DOI: 10.11772/j.issn.1001-9081.2017.03.640
    摘要 ( )   PDF (1235KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对在规模庞大的数据中不能快速准确地选择用户和产品的特征以及不能准确预测用户行为偏好的问题,提出一种CUR矩阵分解方法。该方法是从原始矩阵中选取少量列构成C矩阵,选取少量行构成R矩阵,然后利用正交三角分解(QR)构造U矩阵。分解后的C矩阵和R矩阵分别是用户和产品的特征矩阵,并且CR矩阵是由真实的数据构成的,因此能够分析出具体的用户和产品特征;为了能够比较准确地预测用户的行为偏好,改进了CUR算法,使其在矩阵恢复方面有更高的稳定性和准确性。最后在真实的数据集(Netflix数据集)上的实验表明,与传统的奇异值分解、主成分分析等矩阵分解方法相比:在特征选择方面,CUR矩阵分解方法具有较高的准确度和很好的可解释性;在矩阵恢复方面,改进的CUR矩阵分解方法具有较高的稳定性和精确度,其准确度能达到90%以上。CUR矩阵分解在推荐系统对用户的推荐方面和交通系统预测交通流量方面有重要的应用价值。
    基于迭代填充的内存计算框架分区映射算法
    卞琛, 于炯, 修位蓉, 英昌甜, 钱育蓉
    2017, 37(3):  647-653.  DOI: 10.11772/j.issn.1001-9081.2017.03.647
    摘要 ( )   PDF (1133KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对内存计算框架Spark在作业Shuffle阶段一次分区产生的数据倾斜问题,提出一种内存计算框架的迭代填充分区映射算法(IFPM)。首先,分析Spark作业的执行机制,建立作业效率模型和分区映射模型,给出作业执行时间和分配倾斜度的定义,证明这些定义与作业执行效率的因果逻辑关系;然后,根据模型和定义求解,设计扩展式数据分区算法(EPA)和迭代式分区映射算法(IMA),在Map端建立一对多分区函数,并通过分区函数将部分数据填入扩展区内,在数据分布局部感知后再执行扩展区迭代式的多轮数据分配,根据Reduce端已分配数据量建立适应性的扩展区映射规则,对原生区的数据倾斜进行逐步修正,以此保障数据分配的均衡性。实验结果表明,在不同源数据分布条件下,算法均提高了作业Shuffle过程分区映射合理性,缩减了宽依赖Stage的同步时间,提高了作业执行效率。
    基于关联关系的微博用户可信度分析方法
    李付民, 佟玲玲, 杜翠兰, 李扬曦, 张仰森
    2017, 37(3):  654-659.  DOI: 10.11772/j.issn.1001-9081.2017.03.654
    摘要 ( )   PDF (972KB) ( )  
    参考文献 | 相关文章 | 计量指标
    随着微博研究的深入,对微博用户可信度的评价成为一个研究热点。针对微博用户可信度评价的问题,提出了一种基于关联关系的用户可信度分析方法。以新浪微博为研究对象,首先从用户的资料信息、交互信息和行为信息三个方面出发,分析了用户的7个相关特征,利用层次分析法(AHP),进而得到用户自评价可信度;然后以用户自评价作为基点,以用户关系网络作为载体,结合用户之间潜在的用户互评关系,通过改进PageRank算法,提出了用户可信度评价模型User-Rank,进而,利用关系网络中其他用户对待分析用户的可信度进行综合评价。大规模的微博真实数据的实验表明,所提方法能够取得良好的用户可信度评价效果。
    大数据分析的应用案例——投资模型的稳健性
    覃雄派, 陈跃国, 王邦国
    2017, 37(3):  660-667.  DOI: 10.11772/j.issn.1001-9081.2017.03.660
    摘要 ( )   PDF (1417KB) ( )  
    参考文献 | 相关文章 | 计量指标
    交易模型的稳健性,指的是该模型的利润率曲线的波动性较小,没有大起大落。针对一个基于支持向量回归(SVR)技术的算法交易模型的稳健性问题,提出了使用若干导出指标训练统一的交易模型的策略,以及投资组合多样化的方法。首先,介绍基于支持向量回归技术的算法交易模型;然后,基于常用指标,构造了若干导出指标,用于股票价格的短期预测。这些指标,刻画了近期价格运动的典型模式、超买/超卖市场状态,以及背离市场状态。对这些指标进行了规范化,用于训练交易模型,使得模型可以泛化到不同的股票;最后,设计了投资组合多样化方法。在投资组合里,各个股票之间的相关性,有时会导致较大的投资损失;因为具有较强相关关系的股票,其价格朝相同方向变化。如果交易模型预测的价格走势不正确,引起止损操作,那么这些具有较强相关关系的股票,将引发雪崩式的止损,于是导致损失加剧。把股票根据相似性聚类到不同类别,通过从不同聚类类别中选择若干股票来构成多样化的投资组合,其中,股票的相似性,通过交易模型在不同股票上近期的利润曲线的相似度进行计算。在900只股票10年的价格大数据上进行了实验,实验结果显示,交易模型能够获得超过定期存款的超额利润率,年化利润率为8.06%。交易模型的最大回撤由13.23%降为5.32%,夏普指数由81.23%提高到88.79%,交易模型的利润率曲线波动性降低,说明交易模型的稳健性获得了提高。
    基于改进极限学习机的软测量建模
    周馨, 王国胤, 于洪
    2017, 37(3):  668-672.  DOI: 10.11772/j.issn.1001-9081.2017.03.668
    摘要 ( )   PDF (801KB) ( )  
    参考文献 | 相关文章 | 计量指标
    极限学习机(ELM)因其泛化能力好和学习速度快而成为软测量的新方法,但当应用到铝电解工艺参数建模时,ELM通常需要较多隐层节点并且泛化能力较低。针对这一问题,提出一种基于改进极限学习机(IELM)的软测量模型。首先,利用粗糙集中的约简理论剔除输入变量中的冗余或不相关属性,以降低ELM的输入复杂性;然后,利用偏相关系数对输入变量和输出变量间的相关性进行分析,将输入数据分为正输入和负输入两部分,分别对这两部分建立输入单元,重新构建ELM网络;最后,建立了基于改进极限学习机的铝电解分子比软测量模型。仿真实验结果表明,基于改进极限学习机的软测量模型具有较好的泛化能力和稳定性。
    基于聚类分析分库策略的社交网络数据库查询性能与数据迁移
    梁双, 周丽华, 杨培忠
    2017, 37(3):  673-679.  DOI: 10.11772/j.issn.1001-9081.2017.03.673
    摘要 ( )   PDF (1109KB) ( )  
    参考文献 | 相关文章 | 计量指标
    社交网络数据具有一定的聚合性,即特征上相近的用户之间更容易产生某种行为。依照常规的水平切分方法,在执行这些事件的信息查询时,将会耗费大量的时间和连接损耗去依次访问多个数据库。针对此问题,提出了基于聚类分析的社交网络数据库分库策略。将社交网络主体的特征标量进行聚类,使得聚集程度高的主体尽量分割到一个或尽可能少的几个分库中去,从而提高事件的查询效率,并在此基础上兼顾负载均衡与大数据迁移等问题。实验结果表明,该策略在社交网络的主流事件查询上都表现出不同程度的性能提升,最高提升程度达到23.4%,并且实现了局部最优负载均衡和零数据迁移。总的来说,基于聚类分析的社交网络数据库分库策略在提高查询效率、平衡负载以及大数据迁移可行性上,比传统水平切割分库有了相当的优势。
    基于KL散度和近邻点间距离的球面嵌入算法
    张变兰, 路永钢, 张海涛
    2017, 37(3):  680-683.  DOI: 10.11772/j.issn.1001-9081.2017.03.680
    摘要 ( )   PDF (773KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对现有球面嵌入算法在非近邻点间的距离度量不准确或缺失的情况下,不能有效地进行低维嵌入的问题,提出了一种新的球面嵌入算法,它能够只利用近邻点间的距离,将任何尺度的高维数据嵌入到单位球面上,同时求出适合原始数据分布的球面半径。该算法从一个随机产生的球面分布开始,利用KL散度衡量每对近邻点间的归一化距离在原始空间和球面空间中的差异,并基于此差异构建出目标函数,然后再用带有动量的随机梯度下降法,不断优化球面上点的分布,直到结果稳定。为了测试算法,模拟产生了两类球面分布数据:分别是球面均匀分布和球面正态分布的数据。实验结果表明,对于球面均匀分布的数据,即使在近邻点个数很少的情况下,仍然能够将数据准确地嵌入球面空间,嵌入后的数据分布与原始数据分布的均方根误差(RMSE)低于0.00001,且球面半径的估算误差低于0.000001;而对于球面正态分布的数据,在近邻点个数较多的情况下,该算法也可以将数据较准确地嵌入球面空间。因此,在非近邻点间距离缺失的情况下,所提方法仍然可以较准确地对数据进行低维嵌入,这非常有利于数据的可视化研究。
    第二十五届全国多媒体技术学术会议(NCMT2016)
    基于对比度优化流形排序的显著目标检测算法
    谢畅, 朱恒亮, 林晓, 马利庄
    2017, 37(3):  684-690.  DOI: 10.11772/j.issn.1001-9081.2017.03.684
    摘要 ( )   PDF (1190KB) ( )  
    参考文献 | 相关文章 | 计量指标
    现有的基于背景先验的显著性算法模型中存在先验区域选取不合理的问题,导致计算出的前景区域不准确,影响最终结果。针对该问题提出了基于对比度优化流形排序的显著目标检测算法。利用图像边界信息找出背景先验,设计出采用显著期望、局部对比度以及全局对比度三个指标来衡量先验质量的算法,并根据先验质量设计带权加法,代替简单乘法融合显著先验,从而使显著先验更加准确。从先验中提取显著区域时,更改了选取阈值的策略,更合理地选取出前景区域,再利用流形排序得到显著性图,从而使显著性检测结果更加准确。实验结果表明,与同类算法相比,所提算法突出显著区域,减少噪声,更符合人类视觉感知,并在处理时间上领先于深度学习方法。
    基于PCIe的多路传输系统的DMA控制器设计
    李胜蓝, 姜宏旭, 符炜剑, 陈姣
    2017, 37(3):  691-694.  DOI: 10.11772/j.issn.1001-9081.2017.03.691
    摘要 ( )   PDF (800KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了避免PCIe传输过程中PIO写延时、主机与嵌入式处理系统交互次数过多等问题对于传输带宽的影响,设计了一种基于命令缓冲机制的直接存储访问(DMA)控制器以提高传输带宽利用率。采用FPGA端内部设置命令缓冲区的方式,使得DMA控制器可以缓存PC端的数据传输请求,FPGA根据自身需求动态地访问PC端存储空间,增强了传输灵活性;同时,提出一种动态拼接的DMA调度方法,通过合并相邻存储区访问请求的方式,进一步减少主机与硬件的交互次数和中断产生次数。系统传输速率测试实验中,DMA写最高速率可达1631 MB/s,DMA读最高速率可达1582 MB/s,带宽最大值可达PCIe总线理论带宽值的85.4%;与传统PIO方式的DMA传输方法相比,DMA读带宽提升58%,DMA写带宽提升36%。实验结果表明,本设计能够有效提升DMA传输效率,明显优于PIO方式。
    高动态范围图像客观质量评价方法
    管非凡, 郁梅, 宋洋, 邵华, 蒋刚毅
    2017, 37(3):  695-698.  DOI: 10.11772/j.issn.1001-9081.2017.03.695
    摘要 ( )   PDF (813KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对当前高动态范围(HDR)图像质量评价方法未考虑图像色度和结构信息的问题,提出了一种新的HDR图像客观质量评价方法。首先,利用HDR-VDP-2.2中的基于视觉感知的模型得到关于亮度与对比度的视觉保真度特征;然后,将HDR图像转换到YIQ彩色空间,对彩色空间中的Y、I、Q通道分别进行处理,求得色度相似度和结构相关度特征;最后,利用支持向量回归(SVR)的方法对特征进行融合,预测得到高动态范围图像质量的客观评价值。实验结果表明,与HDR-VDP-2.2相比,该方法的Pearson相关系数和Spearman等级相关系数分别提升了23.09%和25.34%;均方根误差(RMSE)降低了38.01%。所提出的方法与主观视觉感知具有更高的一致性。
    糖尿病性视网膜图像的深度神经网络分类方法
    丁蓬莉, 李清勇, 张振, 李峰
    2017, 37(3):  699-704.  DOI: 10.11772/j.issn.1001-9081.2017.03.699
    摘要 ( )   PDF (1070KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对传统的视网膜图像处理步骤复杂、泛化性差、缺少完整的自动识别系统等问题,提出了一套完整的基于深度神经网络的视网膜图像自动识别系统。首先,对图像进行去噪、归一化、数据扩增等预处理;然后,设计了紧凑的神经网络模型——CompactNet,CompactNet继承了AlexNet的浅层结构参数,深层网络参数则根据训练数据进行自适应调整;最后,针对不同的训练方法和不同的网络结构进行了性能测试。实验结果表明,CompactNet网络的微调方法要优于传统的网络训练方法,其分类指标可以达到0.87,与传统直接训练相比高出0.27;对于LeNet,AlexNet和CompactNet三种网络模型,CompactNet网络模型的分类准确率最高;并且通过实验证实了数据扩增等预处理方法的必要性。
    网络与通信
    基于多层网络流量分析的用户分类方法
    穆桃, 陈伟, 陈松健
    2017, 37(3):  705-710.  DOI: 10.11772/j.issn.1001-9081.2017.03.705
    摘要 ( )   PDF (1121KB) ( )  
    参考文献 | 相关文章 | 计量指标
    对用户进行准确分类对提高客户定制服务的质量具有重要作用,但用户出于隐私保护的考虑,经常不配合网络服务商,拒绝提供个人信息,如地理位置信息、兴趣爱好等。为解决这一问题,在保护用户隐私的前提下,通过分析网络层、应用层等多层网络流量,然后利用K-means聚类、随机森林算法等机器学习方法,预测出用户的地理位置类型(比如公寓、校园等)和兴趣爱好,并分析地理位置类型与用户兴趣爱好的关系,以提高对用户分类的准确性。实验结果表明,此方案可以自适应地划分用户所属用户类型和地理位置类型,通过关联用户的地理位置类型和用户类型提高了用户行为分析的准确性。
    基于公平性的D2D时隙调度算法
    詹金珍, 郭达伟, 滑维鑫
    2017, 37(3):  711-716.  DOI: 10.11772/j.issn.1001-9081.2017.03.711
    摘要 ( )   PDF (936KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对设备到设备(D2D)通信资源分配中的时隙调度时延以及信道增益变化导致吞吐率下降的问题,提出了一种公平性时隙调度(FTDS)算法。首先,基于频谱复用模式建立系统模型,并归纳为一组合优化问题;然后,在模型的次优求解中,FTDS算法将调度周期划分为多个等长的时隙,根据优先级策略将D2D用户分配至不同时隙调度,从而适应D2D用户多于蜂窝用户的应用场景;同时,为了权衡服务质量(QoS)与系统吞吐率的关系,构造一满足性权值与传输速率相互制约,共同决定用户调度优先级。仿真实验中,FTDS算法相比TDS、RANDOM算法,吞吐率平均增幅分别达到11.09%和40.64%,且FTDS算法下D2D用户被调度频次累积分布更为集中;同时,相比TDS算法调度时延最大降低31.22%。仿真实验表明,FTDS算法拥有更优的吞吐率性能、更公平的调度机制、更小的调度时延。
    多检测引擎监测的动态负载均衡算法
    杨忠明, 梁本来, 秦勇, 蔡昭权
    2017, 37(3):  717-721.  DOI: 10.11772/j.issn.1001-9081.2017.03.717
    摘要 ( )   PDF (794KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为解决多引擎入侵检测系统的负载均衡问题,提出一种检测引擎的动态负载调节算法。首先,监测各引擎节点计算负载;然后,以过载或空载节点出现为调度时机,以会话为单位调度重负载节点的流量到低负载节点,并遍历节点进行负载均衡的调节。由于以会话为调度单位,算法并不以负载的绝对平均为目的,只需保障各引擎节点不出现过载或空载即达到基本目标。采用KDD cup99数据集进行模拟实验,实验结果表明,与平均分配流量算法和基于较大流调整的安全分流算法相比,所提算法对检测引擎基于会话的负载均衡效果显著,运行开销较低且降低了重负载状态下的丢包率,有利于提高入侵检测系统的检测率。
    引入梯度下降的蚁群算法求解多约束服务质量路由
    梁本来, 杨忠明, 秦勇, 蔡昭权
    2017, 37(3):  722-729.  DOI: 10.11772/j.issn.1001-9081.2017.03.722
    摘要 ( )   PDF (1256KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前多数改进蚁群算法求解多约束服务质量路由(QoSR)存在收敛速度慢、易陷入局部最优从而效率不高的问题,提出一种引入梯度下降的蚁群算法(ACAGD)。该算法将梯度下降法引入到蚁群的局部搜索中,结合残余信息素,综合决定蚂蚁的下一跳选择策略。蚁群不仅以一定概率按照信息素浓度搜索下一跳,还将以一定概率按照梯度下降法搜索下一跳,从而降低传统蚁群算法容易陷入局部最优的可能性。利用Waxman网络模型随机生成不同路由节点数量的网络拓扑进行仿真实验。实验结果表明,ACAGD相比其他改进蚁群算法,能够在收敛速度不受影响的情况下,取得综合代价相对较低的路由,且算法的稳定性较好。
    基于Stackelberg博弈的双层水下传感器网络功率分配算法
    李鑫滨, 王贝, 韩松
    2017, 37(3):  730-735.  DOI: 10.11772/j.issn.1001-9081.2017.03.730
    摘要 ( )   PDF (944KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对水下传感器协作通信网络中能量消耗严重的问题,为了平衡节点间的能量消耗,同时提高系统的信道容量,提出了基于节点剩余能量的分布式博弈功率分配算法。将用户节点和中继节点间的交易模型构建为双层的Stackelberg博弈,使剩余能量少的节点提供较少的功率进行转发服务,反之则提供较多的功率进行服务,从而平衡节点间的能量消耗。与未考虑剩余能量的算法相比,在有2、3和4个中继节点时,信道容量分别提升了9.4%、23.1%和16.7%。仿真结果表明,该算法不仅提高了系统总的信道容量,而且延长了水下传感器协作通信网络的生存时间。
    基于分段拟合的非线性组合调制雷达信号设计
    张朝霞, 刘杰, 赵岩, 胡秀, 杨玲珍
    2017, 37(3):  736-740.  DOI: 10.11772/j.issn.1001-9081.2017.03.736
    摘要 ( )   PDF (735KB) ( )  
    参考文献 | 相关文章 | 计量指标
    线性调频与伪随机码组合调制的雷达信号可增加信号复杂度,在降低信号被截获概率方面有突出优势,但该组合具有线性调频高旁瓣,且无法克服加窗处理后主瓣宽度增大的缺点。利用驻留相位产生的非线性调频信号能够抑制旁瓣的特点,提出分段拟合的非线性调频与巴克码调制相结合的方法,将其各自的优点加以结合,不仅可以减小距离与速度模糊度,而且可以抑制旁瓣。对该组合信号的显函数模型仿真曲线和模糊函数图进行分析,仿真结果表明,该方法不仅可以降低距离与速度模糊度、降低信号被低截获概率,而且产生了比传统非线性调频更低的旁瓣,说明了该方法用于雷达信号的可行性与优越性。
    数字化仪表着陆系统发射通道校准算法
    冯翔, 张斌
    2017, 37(3):  741-745.  DOI: 10.11772/j.issn.1001-9081.2017.03.741
    摘要 ( )   PDF (780KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在对仪表着陆系统(ILS)的数字化改造中,针对仪表着陆系统采用振幅式测角体制,对发射信号的幅度失真敏感的问题,提出了一种数字化仪表着陆系统发射通道校准算法。首先,建立了仪表着陆系统发射端的数学模型,仿真研究了发射通道非线性对仪表着陆系统测角性能的影响;其次,提出了一种在数字化仪表着陆系统发射机中引入反馈回路的发射机结构;最后,通过在基带利用最小均方(LMS)算法求解发射通道的逆模型,并利用该逆模型补偿发射通道的非线性失真,实现了发射通道的校准。仿真结果表明,该算法可以在噪声条件下快速估计出发射通道的逆模型,具有良好的校准性能。
    先进计算
    多输出数据依赖核支持向量回归快速学习算法
    王定成, 赵友志, 陈北京, 陆一祎
    2017, 37(3):  746-749.  DOI: 10.11772/j.issn.1001-9081.2017.03.746
    摘要 ( )   PDF (735KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对基于递推下降法的多输出支持向量回归算法在模型参数拟合过程中收敛速度慢、预测精度低的情况,使用一种基于秩2校正规则且具有二阶收敛速度的修正拟牛顿算法(BFGS)进行多输出支持向量回归算法的模型参数拟合,同时为了保证模型迭代过程中的下降量和全局收敛性,应用非精确线性搜索技术确定步长因子。通过分析支持向量机(SVM)中核函数的几何结构,构造数据依赖核函数替代传统核函数,生成多输出数据依赖核支持向量回归模型。将模型与基于梯度下降法、修正牛顿法拟合的多输出支持向量回归模型进行对比。实验结果表明,在200个样本下该算法的迭代时间为72.98 s,修正牛顿法的迭代时间为116.34 s,递推下降法的迭代时间为2065.22 s。所提算法能够减少模型迭代时间,具有更快的收敛速度。
    求解TSP的自适应优秀系数粒子群优化算法
    程毕芸, 鲁海燕, 黄洋, 许凯波
    2017, 37(3):  750-754.  DOI: 10.11772/j.issn.1001-9081.2017.03.750
    摘要 ( )   PDF (988KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对基本离散粒子群优化(PSO)算法求解旅行售货商问题(TSP)时容易陷入局部最优解和早熟收敛的问题,提出了一种基于自适应优秀系数的粒子群(SECPSO)算法。为了提高算法的全局搜索能力,在已有工作的基础上,进一步利用启发式信息对静态的路径优秀系数进行修改,使之可根据解的搜索过程进行自适应动态调整;另外,为了进一步提高解的精确性和算法的收敛速度,添加了3-opt搜索机制,提高算法的局部搜索能力。利用Matlab进行了实验仿真,用国际通用的TSP数据库(TSPLIB)中的若干经典实例对算法性能进行了测试。实验结果表明,与其他几种算法相比,SECPSO算法在全局寻优能力和更快的收敛速度方面表现更优,是求解TSP问题的一种有潜力的智能算法。
    基于多目标粒子群优化的虚拟网络映射算法
    李贞, 郑向伟, 张辉
    2017, 37(3):  755-759.  DOI: 10.11772/j.issn.1001-9081.2017.03.755
    摘要 ( )   PDF (940KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在虚拟网络映射中,多数研究只考虑一个映射目标,不能体现多方的利益。为此,将多目标算法和粒子群算法结合,提出了一种基于多目标粒子群优化(PSO)的虚拟网络映射算法(VNE-MOPSO)。首先,在基本的粒子群算法中引入交叉算子,扩大了种群优化的搜索空间;其次,在多目标优化算法中引入非支配排序、拥挤距离排序,从而加快种群的收敛;最后,以同时最小化成本和节点负载均衡度为虚拟网络映射目标函数,采用多目标粒子群优化算法求解虚拟网络映射问题(VNMP)。实验结果表明,采用该算法求解虚拟网络映射问题,在网络请求接受率、平均成本、平均节点负载均衡度、基础设施提供商的收益等方面具有优势。
    多交互式人工蜂群算法及其收敛性分析
    林凯, 陈国初, 张鑫
    2017, 37(3):  760-765.  DOI: 10.11772/j.issn.1001-9081.2017.03.760
    摘要 ( )   PDF (893KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对人工蜂群(ABC)算法不易跳出局部最优解的缺点,提出了多交互式人工蜂群(MIABC)算法。该算法在基本人工蜂群算法的基础上引入随机邻域搜索策略,结合跨维搜索策略,且改进蜜蜂越限处理方式,使得算法搜索方式多样化,从而使得算法搜索更具跳跃性,不易陷入局部最优解,同时,对其进行收敛性分析和性能测试。在五种经典基准测试函数和时间复杂度实验上的仿真结果表明,相对于标准人工蜂群算法和基本粒子群优化(PSO)算法,该算法在1E-2精度下收敛速度提高了约30%和65%,搜索精度更优,且在高维求解问题方面有明显优势。
    网络空间安全
    基于布隆过滤器所有权证明的高效安全可去重云存储方案
    刘竹松, 杨张杰
    2017, 37(3):  766-770.  DOI: 10.11772/j.issn.1001-9081.2017.03.766
    摘要 ( )   PDF (807KB) ( )  
    参考文献 | 相关文章 | 计量指标
    可去重云存储系统中一般采用收敛加密算法,通过计算数据的哈希值作为其加密密钥,使得重复的数据加密后得到相同的密文,可实现对重复数据的删除;然后通过所有权证明(PoW),验证用户数据的真实性来保障数据安全。针对可去重云存储系统中所有权证明时间开销过高导致整个系统性能下降问题,提出了一种基于布隆过滤器进行所有权证明的高效安全方法,实现用户计算哈希值与初始化值的快速验证。最后,提出一种支持细粒度重复数据删除的BF方案,当文件级数据存在重复时进行所有权证明,否则只需要进行局部的文件块级数据重复检测。通过仿真对比实验,结果表明所提BF方案空间开销低于经典Baseline方案,同时时间开销低于经典Baseline方案,在数据文件越大的情况下性能优势更加明显。
    基于深度自编码网络的安全态势要素获取机制
    朱江, 明月, 王森
    2017, 37(3):  771-776.  DOI: 10.11772/j.issn.1001-9081.2017.03.771
    摘要 ( )   PDF (941KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对大规模网络态势要素获取时间复杂度较高和攻击样本不平衡导致小类样本分类精度不高的问题,提出一种基于深度自编码网络的态势要素获取机制。在该机制下,利用优化后的深度自编码网络作为基分类器,识别数据类型。一方面,在自编码网络的逐层训练中,提出一种结合交叉熵(CE)函数和反向传播(BP)算法的训练规则,克服传统的方差代价函数更新权值过慢的缺陷;另一方面,在深度网络的微调和分类阶段,提出一种主动在线采样(AOS)算法应用于分类器中,通过在线选择用于更新网络权值的攻击样本,达到总样本的去冗余和平衡各类攻击样本数量的目的,从而提高小类攻击样本的分类精度。经对实例数据的仿真分析,该方案有较好的态势要素获取精度,并能有效减少数据传输时的通信开销。
    运用差分演化算法实现包匹配多层核心基的提取
    王则林, 郝水侠
    2017, 37(3):  777-781.  DOI: 10.11772/j.issn.1001-9081.2017.03.777
    摘要 ( )   PDF (797KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对网络防火墙、路由器等设备中包匹配的速度问题,提出运用差分演化算法实现包匹配多层核心基的提取。该算法运用多层基础基描述包的多层特征,在每层中分别运用差分演化算法进行比特基和实体基的提取,运用平均自信息和平均互信息量衡量基础基选择的优劣。这种方法可以根据规则库实际规模选择提取比特实体基的层数,非常适应规则库的增长。实验结果表明,所提算法在时间效率、空间效率方面相对于已有的递归数据流匹配算法和基于实数编码的差分演化的包匹配算法,综合性能最优。
    人工智能
    基于Plane-Gaussian神经网络的网络流状态监测
    杨绪兵, 冯哲, 顾一凡, 薛晖
    2017, 37(3):  782-785.  DOI: 10.11772/j.issn.1001-9081.2017.03.782
    摘要 ( )   PDF (792KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对复杂网络环境下网络流监测(分类)问题,为实现多个类别直接分类以及提高学习方法的训练速度,提出了一种随机的人工神经网络学习方法。该方法借鉴平面高斯(PG)神经网络模型,引入随机投影思想,通过计算矩阵伪逆的方法解析获得网络连接矩阵,理论上可证明该网络具有全局逼近能力。在人工数据和标准网络流监测数据上进行了实验仿真,与同样采用随机方法的极限学习机(ELM)和PG网络相比,分析与实验结果表明:1)由于继承了PG网络的几何特性,对平面型分布数据更为有效;2)采用了随机方法,训练速度与ELM相当,但比PG网络快得多;3)三种方法中,该方法更有利于解决网络流监测问题。
    基于无监督学习卷积神经网络的振动信号模态参数识别
    方宁, 周宇, 叶庆卫, 李玉刚
    2017, 37(3):  786-790.  DOI: 10.11772/j.issn.1001-9081.2017.03.786
    摘要 ( )   PDF (905KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对现有的时域模态参数识别方法大多存在难定阶和抗噪性差的问题,提出一种无监督学习的卷积神经网络(CNN)的振动信号模态识别方法。该算法在卷积神经网络的基础上进行改进。首先,将应用于二维图像处理的卷积神经网络改成处理一维信号的卷积神经网络,其中输入层改成待提取模态参数的振动信号集合,中间层改成若干一维卷积层、抽样层,输出层得到的为信号对应的N阶模态参数集合;然后,在误差评估中,对网络计算结果(N阶模态参数集)进行振动信号重构;最后,将重构信号和输入信号之间差的平方和作为网络学习误差,使得网络变成无监督学习网络,避免模态参数提取算法的定阶难题。实验结果表明,当所构建的卷积神经网络应用于模态参数提取时,与随机子空间识别(SSI)算法及其局部线性嵌入(LLE)算法对比,在噪声干扰下,构建的卷积神经网络识别精度要高于SSI算法与LLE算法,具有抗噪声强、避免了定阶难题的优点。
    结合评分和信任关系的社会化推荐算法
    胡云, 李慧, 施珺
    2017, 37(3):  791-795.  DOI: 10.11772/j.issn.1001-9081.2017.03.791
    摘要 ( )   PDF (814KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对推荐系统中普遍存在的数据稀疏和冷启动等问题,提出一种综合评分和信任关系的社会化推荐算法。首先对网络中新用户的初始信任值进行合理赋值,有效地解决了新用户的信任冷启动问题。鉴于用户的喜好会受其朋友的影响,推荐模型又利用朋友之间的信任矩阵对用户自身的特征向量进行修正,解决了用户特征向量的精准构建及信任传递问题。实验结果表明,所提算法较传统的社会网络推荐算法在性能上有显著提高。
    基于偏好不一致熵的有序决策
    潘伟, 佘堃
    2017, 37(3):  796-800.  DOI: 10.11772/j.issn.1001-9081.2017.03.796
    摘要 ( )   PDF (814KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对多规则有序决策系统中的偏好决策问题,根据有序决策的偏好不一致特性,提出了一种基于偏好不一致熵的偏好决策方法。首先,定义了样本的偏好不一致熵(PIEO),用来度量特定样本相对于样本集的偏好不一致程度;然后,根据偏好决策中不同属性对决策的重要性不同的特点,提出了一种加权的样本偏好不一致熵,并结合属性偏好不一致熵在度量属性重要性方面的能力,给出了一种基于属性偏好不一致熵的权值的计算方法;最后,提出了一种基于样本偏好不一致熵的偏好决策算法。采用Pasture Production和Squalsh两个数据集进行仿真实验,基于全局偏好不一致熵分类后,各属性的偏好不一致熵普遍比基于向上和向下偏好不一致熵分类后的熵值小,而且更接近原始决策的偏好不一致熵,这说明基于全局偏好不一致熵的分类比其他两种情况的分类效果好。分类偏离度最小低至0.1282,这说明分类的结果比较接近原始决策。
    计算机视觉与虚拟现实
    视频中人脸位置的定量检测
    魏玮, 马瑞, 王小芳
    2017, 37(3):  801-805.  DOI: 10.11772/j.issn.1001-9081.2017.03.801
    摘要 ( )   PDF (869KB) ( )  
    参考文献 | 相关文章 | 计量指标
    现有的人脸检测评判标准通常情况下仅仅只是对人脸有无的定性检测,对于视频中人脸位置的定量描述并没有严格的规范;另外,现在的一些研究如视频人脸替换等对视频流中人脸位置的连续性有较高的要求。为了解决上述两个问题,相比之前的人脸检测以及人脸跟踪评估标准,提出了一种视频中人脸位置的定量检测评估标准,并且提出了一种视频中人脸位置的检测方法。该方法首先通过改进的Haar-Like级联分类器在目标区域中检测到人脸初始位置;然后采用金字塔光流法对人脸位置进行预测,同时引入正反向误差检测机制实现对结果的自检测,最终确定人脸位置。实验结果表明,检测标准能够对测试算法在视频人脸检测的定量描述结果给出评判,提出的检测算法在人脸位置的时间一致性上有所提升。
    多分辨率LK光流联合SURF的跟踪方法
    厉丹, 鲍蓉, 孙金萍, 肖理庆, 党向盈
    2017, 37(3):  806-810.  DOI: 10.11772/j.issn.1001-9081.2017.03.806
    摘要 ( )   PDF (1022KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对交通监控中运动目标形变、雾霾天气、高速、光照不均、部分遮挡等复杂情况导致Lucas-Kanade(LK)算法跟踪不稳定问题,提出基于多分辨率LK光流算法联合快速鲁棒性特征(SURF)的跟踪算法。所提算法构建图像多分辨率小波金字塔,解决传统LK算法中同一像素点帧间大尺度运动易丢失问题;同时联合SURF尺度不变特征变换算法,提取特征点进行光流跟踪,并制定自适应模板实时更新策略;在减少光流计算量的同时增强运动目标抗复杂环境的能力。实验结果表明,新方法中特征点匹配准确快速,自适应性强,在交通复杂化境中跟踪稳定。
    核相关滤波跟踪算法的尺度自适应改进
    钱堂慧, 罗志清, 李果家, 李应芸, 李显凯
    2017, 37(3):  811-816.  DOI: 10.11772/j.issn.1001-9081.2017.03.811
    摘要 ( )   PDF (961KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对基于检测的核相关滤波跟踪(CSK)算法难以适应目标尺度变化的问题,提出多尺度核相关滤波分类器以实现尺度自适应目标跟踪。首先,采用多尺度图像构建样本集,训练多尺度核相关滤波分类器,通过分类器对目标的尺度估计实现目标的最佳尺度检测;然后,在最佳尺度下采集样本在线学习更新分类器,实现尺度自适应的目标跟踪。对比实验与分析表明,本文算法在目标跟踪过程中能够正确适应目标的尺度变化,相比CSK算法,偏心距误差减少至其1/5~1/3,能满足复杂场景长时间跟踪的需求。
    基于自相似性车载采集城市街景图像的重建
    杨伟, 谢维成, 蒋文波, 石林玉
    2017, 37(3):  817-822.  DOI: 10.11772/j.issn.1001-9081.2017.03.817
    摘要 ( )   PDF (1058KB) ( )  
    参考文献 | 相关文章 | 计量指标
    大众化的车载为确保实时、高速的图像显示及图像存储,其捕获的图像通常会呈现出较低的分辨率,严重影响了突发状况时有效图像信息的获取。针对该低分辨率的城市街景图像采用了一种基于透视变换、高频补偿的自相似性图像重建方法。该算法在仿射变换的基础上增加了透视变换来进行图像块的匹配,并对每一个匹配的图像块进行高频补偿以恢复构建图像金字塔时丢失的高频信息,通过多尺度非局部方法搜索图像金字塔,合成匹配图像块得到最终的高分辨率图像。采用该算法对采集到的大量低分辨率城市街景图像进行重建,并与ScSR、Upscaling、SCN这三种典型的算法进行对比,实验结果表明该算法在几种盲评价指标上较其他算法好,在提高图像分辨率的同时能保持图像的边缘和细节信息。
    图像分割中改进空间约束贝叶斯网络模型的应用
    张海艳, 高尚兵
    2017, 37(3):  823-826.  DOI: 10.11772/j.issn.1001-9081.2017.03.823
    摘要 ( )   PDF (809KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对马尔可夫链蒙特卡罗方法普遍存在的迭代收敛性问题,在具有空间平滑约束的高斯混合模型条件上提出改进空间约束贝叶斯网络模型并在图像分割领域进行具体应用。所提模型应用隐狄利克雷分布(LDA)概率密度模型和高斯-马尔可夫定理的随机域参数混合过程来实现参数平滑。所提方法根据空间信息先验平滑变换操作,在待处理像素点的上下文混合结构中引入LDA符合多项式分布,用来替换传统期望最大化算法中映射操作。LDA参数采用闭合形式将有利于准确估计最大后验概率(MAP)框架与上下文混合结构的相关比例。实验结果表明,应用PRI、VoI、GCE和BDE指标进行效果比较,该方法比联合系统工程组(JSEG)、当前变换矩阵(CTM)和最大后验概率-最大似然法(MM)方法的图像分割应用效果较好,高斯噪声对于该算法的鲁棒性影响较小。
    基于图像分块的局部阈值二值化方法
    张洁玉
    2017, 37(3):  827-831.  DOI: 10.11772/j.issn.1001-9081.2017.03.827
    摘要 ( )   PDF (889KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前局部阈值二值化结果存在目标虚假或断裂的缺陷,提出了一种基于图像分块的局部阈值二值化方法。首先,将图像分成若干子块并分析每个子块像素灰度变化情况;接着,取一定大小的局部窗口在图像中移动,比较该局部窗口内与包含窗口自身且比窗口更大区域内的像素灰度变化情况,更大区域由窗口模板当前覆盖的所有子块组成,以此判断窗口内是否为灰度变化平坦(或剧烈)区域;最后,根据不同的区域,给出具体的二值化方案。利用7种不同算法对4种不同类型的4组图像进行了二值化实验。实验结果表明该算法在屏蔽背景噪声和保留目标细节方面表现最优,特别地通过对车牌图像的二值化结果进行定量分析后发现该算法能够得到最高召回率和准确率。
    采用自适应四点窗中点滤波的高椒盐噪声滤除方法
    张新明, 康强, 程金凤, 涂强
    2017, 37(3):  832-838.  DOI: 10.11772/j.issn.1001-9081.2017.03.832
    摘要 ( )   PDF (1209KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对当前中值滤波器处理图像高椒盐噪声效果不佳和实时性不强等问题,提出了一种快速自适应四点窗中点滤波(AFMF)方法。首先,为了降低计算复杂度,使用简单的极值方法检测噪声点;然后,摒弃传统的全点窗口,不用中值滤波,而是在开关滤波和裁剪滤波的基础上,采用新型的非线性滤波方法:中点滤波,简化了算法的流程,提升了算法的计算效率,提高了去噪效果;最后,从3×3窗口开始到由里向外推进,逐渐增大窗口,形成自适应滤波,一直到噪声点处理完,如此避免了窗口大小参数的设置。实验结果表明,与AMF、SAMF、MDBUTMF以及DBCWMF相比,AFMF在处理高密度椒盐噪声上不仅有更好的去噪性能、更快的运行速度(约0.18 s),且无需设置参数,可操作性强,具有较强的实用性。
    基于暗通道原理从单幅遥感影像估计山脉高程的方法
    盛婷婷, 陈强, 孙权森
    2017, 37(3):  839-843.  DOI: 10.11772/j.issn.1001-9081.2017.03.839
    摘要 ( )   PDF (901KB) ( )  
    参考文献 | 相关文章 | 计量指标
    根据单幅遥感图像估计高程信息可以应用于滑坡、泥石流等自然灾害的检测,因此,提出了一种基于暗通道原理的单幅遥感图像高程值提取算法,并对山脉的阴影部分进行了改进。运用了暗通道原理,同时给出了一种克服山脉阴影影响的解决策略。对大量山脉遥感图像进行了定量和定性分析,提出的算法能够得到较准确的山脉相对高程信息。综上所述,改进算法能够有效提取出包含阴影的单幅山脉遥感图像的高程信息。
    基于特征线分段技术的牙齿分割算法
    肖兵, 魏昕, 胡伟, 夏鸿建
    2017, 37(3):  844-848.  DOI: 10.11772/j.issn.1001-9081.2017.03.844
    摘要 ( )   PDF (916KB) ( )  
    参考文献 | 相关文章 | 计量指标
    牙齿分割是计算机口腔正畸的重要技术,针对三维牙颌模型直接进行牙齿分割而不对齿间融合区域进行处理会存在精确度较差、缺失侧面形状的问题,以及现有牙齿形状建模方法交互多、效率低的问题,提出一种基于特征线分段技术的牙齿分割算法。根据曲率信息筛选特征区域并采用形态学算法提取牙列特征线;结合特征线分段和分支点匹配算法以及形态学膨胀操作实现齿间融合区域的自动识别;利用匹配的分支点对齿间孔洞搭桥修补,实现牙齿形状的自动恢复;提取齿间龈缘线,然后以所有龈缘线作为牙齿分割线分离出单颗牙齿。实验结果表明,该算法不仅能准确分离出具有侧面形状的单颗牙齿,而且避免了牙齿形状建模时的交互操作,而且与手动识别并删除齿间粘连区域、采用曲面能量约束方式重建齿间缺失曲面的方法相比,提高了牙齿分割效率60%~90%。
    基于X射线图像的厚钢管焊缝中气孔缺陷的自动检测
    陈本智, 方志宏, 夏勇, 张灵, 兰守忍, 王利生
    2017, 37(3):  849-853.  DOI: 10.11772/j.issn.1001-9081.2017.03.849
    摘要 ( )   PDF (866KB) ( )  
    参考文献 | 相关文章 | 计量指标
    由于厚钢管X射线图像强度分布不均匀,对比度低、噪声大,且气孔缺陷的大小、形状、位置、对比度各异,使得自动检测各种类型的气孔较为困难。针对传统缺陷检测算法中手工标记缺陷数据工作量大,焊缝边缘难以准确提取等问题,提出一种新的无监督学习的各种气孔缺陷检测算法。首先,采用快速独立分量分析从钢管X射线图像集合中学习一组独立基底,并用该基底的线性组合来选择性重构带气孔缺陷的测试图像;随后,测试图像与其重构图像相减获得差异图像,通过全局阈值从差异图像中将各种气孔分割出来。实验的训练集有320幅,测试集有60幅图像,所提算法检测结果的平均敏感性和准确率为90.5%和99.7%。实验结果表明,该算法无需手工标记数据或提取焊缝边缘,可准确检测各种气孔缺陷。
    数据科学与技术
    基于时空模式的轨迹数据聚类算法
    石陆魁, 张延茹, 张欣
    2017, 37(3):  854-859.  DOI: 10.11772/j.issn.1001-9081.2017.03.854
    摘要 ( )   PDF (1146KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对轨迹聚类算法在相似性度量中多以空间特征为度量标准,缺少对时间特征的度量,提出了一种基于时空模式的轨迹数据聚类算法。该算法以划分再聚类框架为基础,首先利用曲线边缘检测方法提取轨迹特征点;然后根据轨迹特征点对轨迹进行子轨迹段划分;最后根据子轨迹段间时空相似性,采用基于密度的聚类算法进行聚类。实验结果表明,使用所提算法提取的轨迹特征点在保证特征点具有较好简约性的前提下较为准确地描述了轨迹结构,同时基于时空特征的相似性度量因同时兼顾了轨迹的空间与时间特征,得到了更好的聚类结果。
    基于实时数据和历史查询分布的时空索引新方法
    孟学潮, 叶少珍
    2017, 37(3):  860-865.  DOI: 10.11772/j.issn.1001-9081.2017.03.860
    摘要 ( )   PDF (977KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在大数据时代,数据具有体量大、时空复杂性明显、对实时性要求较高等特点,而传统基于树形结构对大规模时空数据进行索引的方法存在存储空间浪费和查询效率较低的问题。为了解决该问题,提出了一种基于数据和历史查询记录分布建立时空索引的新方法HDL-index。该算法一方面根据数据在空间上的分布,通过空间划分的思想建立索引网格;另一方面考虑到查询在时间上的延续性,对查询记录对象进行密度聚类后抽象出查询代表模型,然后根据模型的坐标位置和其查询粒度对整体查询区域进行分割。两部分所得到的索引网格都采用Geohash编码,最终合并得到最优的索引编码。HDL-index在考虑数据分布的同时充分考虑用户查询行为,使得频繁查询区域上的索引更加细化。在真实航空数据集上与同类方法进行比较测试的结果表明,其创建索引的效率提高了50%;同时在数据均匀分布的情况下对热点区域的查询效率可提高75%以上。
    基于特征聚类集成技术的在线特征选择
    杜政霖, 李云
    2017, 37(3):  866-870.  DOI: 10.11772/j.issn.1001-9081.2017.03.866
    摘要 ( )   PDF (1000KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对既有历史数据又有流特征的全新应用场景,提出了一种基于组特征选择和流特征的在线特征选择算法。在对历史数据的组特征选择阶段,为了弥补单一聚类算法的不足,引入聚类集成的思想。先利用k-means方法通过多次聚类得到一个聚类集体,在集成阶段再利用层次聚类算法对聚类集体进行集成得到最终的结果。在对流特征数据的在线特征选择阶段,对组构造产生的特征组通过探讨特征间的相关性来更新特征组,最终通过组变换获得特征子集。实验结果表明,所提算法能有效应对全新场景下的在线特征选择问题,并且有很好的分类性能。
    基于偏最小二乘回归的鲁棒性特征选择与分类算法
    尚志刚, 董永慧, 李蒙蒙, 李志辉
    2017, 37(3):  871-875.  DOI: 10.11772/j.issn.1001-9081.2017.03.871
    摘要 ( )   PDF (818KB) ( )  
    参考文献 | 相关文章 | 计量指标
    提出一种基于偏最小二乘回归的鲁棒性特征选择与分类算法(RFSC-PLSR)用于解决特征选择中特征之间的冗余和多重共线性问题。首先,定义一个基于邻域估计的样本类一致性系数;然后,根据不同k近邻(kNN)操作筛选出局部类分布结构稳定的保守样本,用其建立偏最小二乘回归模型,进行鲁棒性特征选择;最后,在全局结构角度上,用类一致性系数和所有样本的优选特征子集建立偏最小二乘分类模型。从UCI数据库中选择了5个不同维度的数据集进行数值实验,实验结果表明,与支持向量机(SVM)、朴素贝叶斯(NB)、BP神经网络(BPNN)和Logistic回归(LR)四种典型的分类器相比,RFSC-PLSR在低维、中维、高维等不同情况下,分类准确率、鲁棒性和计算效率三种性能上均表现出较强的竞争力。
    非规范化中文地址的行政区划提取算法
    李晓林, 黄爽, 卢涛, 李霖
    2017, 37(3):  876-882.  DOI: 10.11772/j.issn.1001-9081.2017.03.876
    摘要 ( )   PDF (1226KB) ( )  
    参考文献 | 相关文章 | 计量指标
    由于互联网上中文地址的非规范化表达,导致互联网中的中文地址信息在地理位置服务中难以直接应用。针对此问题,提出一种非规范中文地址的行政区划提取算法。首先,对原始数据进行“路”特征词分组预处理;再利用行政区划字典和移动窗口最大匹配算法,从中文地址中提取所有可能的行政区划数据集;然后,利用中文地址行政区划元素之间具有层次关系的特点,建立行政区划条件集合运算规则,对获取的数据集进行集合运算;再利用行政区划匹配度建立一种行政区划集合解析规则,来计算行政区划可信度;最后,得到可信度最大信息量最完整的中文地址的行政区划。利用从互联网中提取的约25万条中文地址数据进行是否采用“路”特征词分组处理以及是否进行可信度计算处理,对算法的可用性进行了验证,并与目前的地址匹配技术进行对比,准确率达到93.51%。
    应用前沿、交叉与综合
    面向自动驾驶的动态路径规划避障算法
    周慧子, 胡学敏, 陈龙, 田梅, 熊豆
    2017, 37(3):  883-888.  DOI: 10.11772/j.issn.1001-9081.2017.03.883
    摘要 ( )   PDF (1001KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对自动驾驶中避障的动态路径规划问题,提出一种在已知车辆的初始位置、速度、方向和障碍物位置情况下,实时避开障碍物的动态规划算法。首先,利用三次样条曲线的二阶连续性,结合已知的车道信息产生道路基准线;其次,以车辆的位置方向和道路的曲率构建s-q坐标系,并在s-q坐标系内产生从车辆当前位置到目的位置的一簇平滑曲线,作为候选路径;最后,综合考虑车辆行驶的安全性、平滑性和连贯性准则,设计一种新的代价函数,并且通过使代价函数最小化的方法从候选路径中选择最佳路径。在实验过程中,通过设计多种不同的模拟道路来检验算法的性能。实验结果表明,该方法在多种地形的单车道和多车道道路上都能够规划出安全、平滑的路径,有效避开障碍物,并且具有较好的实时性。
    基于多任务学习的炼钢终点预测方法
    程进, 王坚
    2017, 37(3):  889-895.  DOI: 10.11772/j.issn.1001-9081.2017.03.889
    摘要 ( )   PDF (1088KB) ( )  
    参考文献 | 相关文章 | 计量指标
    钢水质量通常根据终点命中率来判断,但炼钢过程影响因素众多,机理分析难以准确预测终点温度和含碳量,鉴于此,提出一种由数据驱动的多任务学习(MTL)炼钢终点预测方法。首先,分析并提取炼钢过程的输入和输出要素,结合炼钢两阶段吹炼特点选择多个子学习任务;其次,根据子任务与终点参数的相关性选择合适的子任务,提升终点预测的准确度并构建多任务学习模型,再对模型输出结果进行二次优化;最后,通过近端梯度算法对处理后的生产数据进行模型训练,获取多任务学习模型的过程参数。以某钢厂为案例,该方法相比神经网络在终点温度12℃误差范围内和终点含碳量0.01%误差内的准确度提升了10%,误差范围6℃和0.005%的预测准确度分别提升了11%和7%。实验结果表明,多任务学习在实际中能够提升终点预测的准确性。
    基于多任务学习的多姿态人脸重建与识别
    欧阳宁, 马玉涛, 林乐平
    2017, 37(3):  896-900.  DOI: 10.11772/j.issn.1001-9081.2017.03.896
    摘要 ( )   PDF (881KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对当前人脸识别中姿态变化会影响识别性能,以及姿态恢复过程中脸部局部细节信息容易丢失的问题,提出一种基于多任务学习的多姿态人脸重建与识别方法——多任务学习堆叠自编码器(MtLSAE)。该方法通过运用多任务学习机制,联合考虑人脸姿态恢复和脸部局部细节信息保留这两个相关的任务,在步进逐层恢复正面人脸姿态的同时,引入非负约束稀疏自编码器,使得非负约束稀疏自编码器能够学习到人脸部的部分特征;其次在姿态恢复和局部信息保留两个任务之间通过共享参数的方式来学习整个网络框架;最后将重建出来的正脸图像通过Fisherface进行降维并提取具有判别信息的特征,并用最近邻分类器来识别。实验结果表明,MtLSAE方法获得了较好的姿态重建质量,保留的局部纹理信息清晰,而且与局部Gabor二值模式(LGBP)、基于视角的主动外观模型(VAAM)以及堆叠步进自编码器(SPAE)等经典方法相比,识别率性能得以提升。
    基于稀疏表示和弹性网络的人脸识别
    李光早, 王士同
    2017, 37(3):  901-905.  DOI: 10.11772/j.issn.1001-9081.2017.03.901
    摘要 ( )   PDF (822KB) ( )  
    参考文献 | 相关文章 | 计量指标
    由于稀疏表示方法在人脸分类算法中的成功使用,在此基础上提出了一种更为有效的基于稀疏表示(SRC)和弹性网络相结合的分类方法。为了加强样本间的协作表示能力以及增强处理强相关性变量数据的能力,基于迭代动态剔除机制,提出一种结合弹性网络的稀疏分解方法。通过采用训练样本的线性组合来表示测试样本,并运用迭代机制从所有样本中剔除对分类贡献度较小的类别和样本,采用Elastic Net算法来进行系数分解,从而选择出对分类贡献度较大的样本和类别,最后根据计算相似度对测试样本进行分类。在ORL、FERET和AR三个数据集进行了许多实验,实验结果显示算法识别率分别达到了98.75%、86.62%、99.72%,表明了所提算法的有效性。所提算法相比LASSO和SRC-GS等方法,在系数分解过程中增强了处理高维小样本和强相关性变量数据的能力,突出了稀疏约束在该算法中的重要性,具有更高的准确性和稳定性,能够更加有效地适用于人脸分类。
    基于MAP+CMLLR的说话人识别中发声力度问题
    黄文娜, 彭亚雄, 贺松
    2017, 37(3):  906-910.  DOI: 10.11772/j.issn.1001-9081.2017.03.906
    摘要 ( )   PDF (847KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于对正常语音训练的说话人模型进行更新,而CMLLR特征空间投影方法则用来投影转换耳语、高喊测试语音的特征,从而改善训练语音与测试语音的失配问题。实验结果显示,采用MAP+CMLLR方法时,说话人识别系统等错误率(EER)明显降低,与基线系统、最大后验概率(MAP)自适应方法、最大似然线性回归(MLLR)模型投影方法和约束最大似然线性回归(CMLLR)特征空间投影方法相比,MAP+CMLLR方法的平均等错率分别降低了75.3%、3.5%、72%和70.9%。实验结果表明,所提出方法削弱了发声力度对说话人区分性的影响,使说话人识别系统对于发声力度变化更加鲁棒。
    基于伪随机码调制的车载激光雷达距离速度同步测量方法
    郑刚, 程用志, 毛雪松
    2017, 37(3):  911-914.  DOI: 10.11772/j.issn.1001-9081.2017.03.911
    摘要 ( )   PDF (712KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对双检测器激光雷达系统用于同步测量道路目标距离和速度时存在的成本高、回波利用效率低的问题,提出了一种基于伪随机(PN)码调制的脉冲式多普勒激光雷达结构模型,研究使用单个光外差接收器同步测量目标距离和速度的可行性并通过计算机仿真验证方法的性能。首先,给出激光雷达的系统模型,分析模型在脉冲方式下用于距离和速度测量时存在的问题;然后,讨论通过单个光外差接收器输出的电信号计算目标距离和速度的方法,即计算输出信号与本地调制码的相关函数确定激光飞行时间进而得出目标距离和使用非等间隔采样信号频谱分析方法确定输出信号的多普勒频率进而得出目标的速度;最后通过仿真验证所提出的方法可同时实现目标距离和速度的稳定检测。实验结果表明,在道路环境中该方法可实现目标距离和速度的稳定可靠测量,与直接检测系统相比,测量的灵敏度可提高10 dB以上,且与回波的到达时间、多普勒频率的大小无关。
2024年 44卷 3期
刊出日期: 2024-03-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会