《计算机应用》唯一官方网站

武志学

2017, 37(4): 915-923. DOI: 10.11772/j.issn.1001-9081.2017.04.0915

摘要 ( )

PDF (1633KB) ( )

参考文献 | 相关文章 | 计量指标

云计算是一种融合了多项计算机技术的以数据和处理能力为中心的密集型计算模式，其中以虚拟化、分布式数据存储、分布式并发编程模型、大规模数据管理和分布式资源管理技术最为关键。经过十多年的发展，云计算技术已经从发展培育期步入快速成长期，越来越多的企业已经开始使用云计算服务。与此同时，云计算的核心技术也在发生着巨大的变化，新一代的技术正在改进甚至取代前一代技术。容器虚拟化技术以其轻便、灵活和快速部署等特性对传统的基于虚拟机的虚拟化技术带来了颠覆性的挑战，正在改变着基础设施即服务（IaaS）平台和平台即服务（PaaS）平台的架构和实现。对容器虚拟化技术进行深入介绍，并通过分析和比较阐述容器虚拟化技术和虚拟机虚拟化技术各自的优势、适应场景和亟待解决的问题，然后对云计算虚拟化技术的下一步研究方向和发展趋势进行展望。

级联式低消耗大规模网页分类在线获取方法

王亚强, 汤铭, 曾沁, 唐聃, 舒红平

2017, 37(4): 924-927. DOI: 10.11772/j.issn.1001-9081.2017.04.0924

摘要 ( )

PDF (847KB) ( )

参考文献 | 相关文章 | 计量指标

针对海量网页在线自动高效获取网页分类系统设计中如何更有效地平衡准确度与资源开销之间的矛盾问题，提出一种基于级联式分类器的网页分类方法。该方法利用级联策略，将在线与离线网页分类方法结合，各取所长。级联分类系统的一级分类采用在线分类方法，仅利用锚文本中网页标题包含的特征预测其分类，同时计算分类结果的置信度，分类结果的置信度由分类后验概率分布的信息熵度量。若置信度高于阈值（该阈值采用多目标粒子群优化算法预先计算取得），则触发二级分类器。二级分类器从下载的网页正文中提取特征，利用预先基于网页正文特征训练的分类器进行离线分类。结果表明，相对于单独的在线法和离线法，级联分类系统的F1值分别提升了10.85%和4.57%，并且级联分类系统的效率比在线法未降低很多（30%左右），而比离线法的效率提升了约70%。级联式分类系统不仅具有更高的分类能力，而且显著地减少了分类的计算开销与带宽消耗。

基于Spark Streaming的实时能耗分项计量系统

武志学

2017, 37(4): 928-935. DOI: 10.11772/j.issn.1001-9081.2017.04.0928

摘要 ( )

PDF (1408KB) ( )

参考文献 | 相关文章 | 计量指标

能耗分项计量能够准确、及时、有效地发现能源使用问题，形成和实现最有效的节能措施。能耗分项计量系统需要对各项能源使用量在不同粒度上进行统计，既有实时性的需求，又需要涉及到聚合、去重、连接等较为复杂的统计需求。由于数据产生快、实时性强、数据量大，所以很难统一采集并入库存储后再作处理，这便导致传统的数据处理架构不能满足需求。为此，提出基于Spark Streaming大数据流式技术构建一个实时能耗分项计量系统，对实时能耗分项计量的系统架构和内部结构进行了详细介绍，并通过实验数据分析了系统的实时数据处理能力。与传统架构不同，实时能耗分项计量系统在数据流动的过程中实时地进行捕捉和处理，一方面把捕捉到的异常信息及时报警到前端，同时把分类分项统计处理的结果保存到数据库，以便进行离线分析和数据挖掘，能有效地解决上述数据处理过程中遇到的问题。

基于多斜率码链的阵列纠删码

唐聃, 杨昊澎, 王福超

2017, 37(4): 936-940. DOI: 10.11772/j.issn.1001-9081.2017.04.0936

摘要 ( )

PDF (854KB) ( )

参考文献 | 相关文章 | 计量指标

针对当前大多阵列纠删码容错能力偏低以及构造时需要满足的约束条件较强的问题，提出一类基于码链构造的阵列纠删码。该阵列纠删码使用不同斜率码链组织数据元素和校验元素间的关系，从而能达到理论上不受限制的容错能力；而在构造时避开了类似素数约束的强约束条件，易于实用和扩展。仿真实验结果表明，相对于RS（Reed-Solomon）码，基于多斜率码链阵列纠删码在运算效率上的提升超过了2个数量级；在固定的容错能力下，存储效率能随着条块尺寸的增加而提高。此外，该类阵列码的修复代价和更新代价为一个固定常量，不会随着系统规模的扩大或容错能力的提高而增加。

基于分布式计算框架的风暴三维追踪方法

曾沁, 李永生

2017, 37(4): 941-944. DOI: 10.11772/j.issn.1001-9081.2017.04.0941

摘要 ( )

PDF (706KB) ( )

参考文献 | 相关文章 | 计量指标

气象数据的增长规模已达到每小时TB级，这使得传统基于关系型数据库和文件存储系统在海量数据存储与管理方面捉襟见肘，进而使得基于大规模异构气象数据的应用无法规模化，同时，也无法满足科研人员对海量气象数据高效探索的需要。为解决这一系列问题，研究者分别基于MapReduce、HBase等分布式框架下的分布式计算和存储技术，尝试为海量气象数据的探索提供有效技术手段，然而，综合性的研究据了解还未开展。因此，利用近年来积累的海量多普勒天气雷达数据，开展了基于MapReduce和HBase相结合的风暴三维追踪方法的研究，并基于传统Rest标准化接口实现了雷达资料的点、线、面、体的多种分布式服务接口，与传统的Rest标准化单机数据存储和访问接口的性能相比，所实现方法在性能方面有100%的效率提升。最后，以2007年至2009年珠江三角洲地区三年雷达数据的风暴追踪回算为例，进一步验证了所提方法在计算和存储管理方面的性能优势。

蜂窝网络下基于max-min公平性的D2D功率分配

尼俊红, 申振涛, 杨会峰

2017, 37(4): 945-947. DOI: 10.11772/j.issn.1001-9081.2017.04.0945

摘要 ( )

PDF (543KB) ( )

参考文献 | 相关文章 | 计量指标

针对多个终端直通通信（D2D）用户共享多个蜂窝用户资源的公平性问题，在保证蜂窝用户速率的前提下，提出了基于最大最小公平性（max-min fairness）的功率分配算法。该算法首先将非凸优化问题转化为含凸函数的差（DC）规划问题，然后采用凸近似的全局优化算法和对分算法对D2D实现功率优化。仿真结果表明，与只采用凸近似的全局优化算法相比，所提算法收敛性更优，同时最大化了瓶颈用户的速率。

基于资源效用最大化的虚拟网络功能备份方法

周桥, 伊鹏, 门浩崧

2017, 37(4): 948-953. DOI: 10.11772/j.issn.1001-9081.2017.04.0948

摘要 ( )

PDF (962KB) ( )

参考文献 | 相关文章 | 计量指标

针对网络功能虚拟化环境下组成服务功能链的虚拟网络功能故障所引起的网络服务故障问题，提出一种最大化资源效用的虚拟服务功能备份方法来提高网络可靠性。首先，对虚拟服务功能备份问题进行详细分析并建立了可靠性评估模型，提出了改进的备份机制，并证明了该机制与其他机制相比的优势；其次，对全网络设计了全局备份算法和备份选择策略来对相应的虚拟网络功能选取备份直到满足可靠性需求。仿真实验结果表明，与GREP方法、联合备份机制加上随机选择策略（JP+random selection）及双重共享式备份机制加上随机选择策略（DSP+random selection）相比，该方法在可靠性和资源利用率上取得了优异的性能，特别是服务功能链请求接受率提高18.8%~25%，资源效用利用率提高15%~20%。实验结果表明该方法能较为有效地利用资源来提升网络可靠性。

基于离散序列报文的协议格式特征自动提取算法

李阳, 李青, 张霞

2017, 37(4): 954-959. DOI: 10.11772/j.issn.1001-9081.2017.04.0954

摘要 ( )

PDF (1104KB) ( )

参考文献 | 相关文章 | 计量指标

针对缺少会话信息的离散序列报文，提出一种基于离散序列报文的协议格式（SPMbFSC）特征自动提取算法。SPMbFSC在对离散序列报文进行聚类的基础上，通过改进的频繁模式挖掘算法提取出协议关键字，进一步对协议关键字进行选择，筛选出协议格式特征。仿真结果表明，SPMbFSC在以单个报文为颗粒度的识别中对FTP、HTTP等六种协议的识别率均能达到95%以上，在以会话为颗粒度的识别中识别率可达90%。同等实验条件下性能优于自适应特征（AdapSig）提取方法。实验结果表明SPMbFSC不依赖会话数据的完整性，更符合实际应用中由于接收条件限制导致会话信息不完整的情形。

认知无线电中基于多址接入信道的多用户联合频谱感知算法

王思秀, 郭文强, 汪晓洁

2017, 37(4): 960-964. DOI: 10.11772/j.issn.1001-9081.2017.04.0960

摘要 ( )

PDF (684KB) ( )

参考文献 | 相关文章 | 计量指标

针对多用户联合感知场景问题，考虑次用户至决策中心之间有损信道的情况，提出了基于多址接入信道（MAC）的联合频谱感知算法。在系统结构和数学建模基础上，分析了传统MAC算法渐近性、中断概率等性能。在次用户平均发射功率约束下，以最大化检测概率为目标，对基于MAC算法中的发射增益进行优化；并考虑了一定服务质量情况下最小化次用户数目的问题。仿真结果表明，MAC算法能够保证良好的检测性能，以决策中心错误概率为例，提出的优化算法取得了指数级的性能提升。

基于改进离散果蝇优化算法的WSN广播路由算法

徐同伟, 何庆, 吴意乐, 顾海霞

2017, 37(4): 965-969. DOI: 10.11772/j.issn.1001-9081.2017.04.0965

摘要 ( )

PDF (765KB) ( )

参考文献 | 相关文章 | 计量指标

为解决无线传感网络（WSN）节点能量限制和广播路由的能耗问题，提出一种基于改进离散果蝇优化算法（DFOA）的WSN广播路由算法。首先，将交换子和交换序引入到果蝇优化算法（FOA）中，得到DFOA，拓展FOA的应用领域；然后，利用莱维（Lévy）飞行对果蝇随机探索的步长进行控制，增加DFOA的样本多样性，并用轮盘赌选择对种群的位置更新策略进行改进，避免算法陷入局部最优；最后利用改进DFOA对WSN路由能耗寻优，找到能耗最小的广播路径。仿真结果表明，改进DFOA获得的广播能耗更低，在不同的网络规模下，均优于对比算法（原DFOA、模拟退火遗传算法（SA-GA）、蚁群优化（ACO）算法和粒子群优化（PSO）算法）。改进DFOA能增加种群多样性，增强跳出局部最优的能力，提高网络性能。

基于孤立节点分离策略的改进鲁汶算法

李雷, 闫光辉, 杨绍文, 张海韬

2017, 37(4): 970-974. DOI: 10.11772/j.issn.1001-9081.2017.04.0970

摘要 ( )

PDF (905KB) ( )

参考文献 | 相关文章 | 计量指标

鲁汶算法（LM）是基于模块度优化的复杂网络社区发现算法，有关模块度的现有研究中没有计算节点离开原属社区后模块度增益的方法。针对这一不足，基于模块度的定义和节点合并后模块度增益的计算方法，推导出了节点离开原属社区后模块度增益的计算方法，完善了该领域的理论研究。针对鲁汶算法对存储空间需求高的缺点，提出了基于孤立节点分离策略的改进鲁汶算法，该算法在每次迭代中将输入网络的孤立节点提前分离出去，只令其中的连通节点实际参与迭代过程，并在存储社区发现结果时将孤立节点和非孤立节点分开存储。基于真实网络的相关实验结果表明，采用孤立节点分离策略的改进方法，使算法对存储空间的需求减少了40%以上，并进一步缩短了算法的运行时间。因此，改进后的算法在处理真实网络时更具优势。

基于delta码的乘除法运算错误检测改进算法

孙宗奇, 臧海娟, 张春花, 潘勇

2017, 37(4): 975-979. DOI: 10.11772/j.issn.1001-9081.2017.04.0975

摘要 ( )

PDF (898KB) ( )

参考文献 | 相关文章 | 计量指标

为确保安全苛求系统中程序执行的正确性，研究人员将差错控制理论用于对计算机指令进行编码，但由于编码大多涉及模运算，导致复杂度大量增加，应用于实时系统有困难。针对复杂度问题对delta码的乘除法运算算法进行改进。算法在乘法运算中引入冗余编码及差异化思想，从而确保安全性；在除法运算中引入逆元，将除法运算转化为低复杂度的乘法运算，避免了模运算带来的开销，降低了复杂度并提高了算法安全性，并对安全性进行理论论证。理论分析表明：所提算法漏检率可达2.3×10^-10。测试结果表明，所提算法的漏检率与理论值相符，且复杂度是未编码运算6.4~7.2倍，比原delta码降低了7%~19%，在漏检率与复杂度方面均满足安全苛求系统的应用要求。

基于似然分布调整的粒子群优化粒子滤波新方法

高国栋, 林明, 许兰

2017, 37(4): 980-985. DOI: 10.11772/j.issn.1001-9081.2017.04.0980

摘要 ( )

PDF (937KB) ( )

参考文献 | 相关文章 | 计量指标

传统基于粒子群优化的粒子滤波（PF）算法（PSOPF）在移动粒子向高似然区域移动的过程中，由于破坏了预测分布，当似然函数具有多峰时，其在具有大计算量的同时滤波性能并没有明显提升。针对该问题，提出了基于似然分布调整的粒子群优化粒子滤波新方法（LA-PSOPF）。在保留预测分布的前提下，运用PSO算法调整似然分布，提高有效粒子数量，进而提高滤波性能；同时引入局部优化策略，缩减参与PSO优化的粒子群规模，从而减少运算量，达到滤波精度与速度的平衡。仿真结果表明，当量测误差较小，似然函数具有多峰值时，改进算法的滤波精度和稳定性都优于PF算法和PSOPF算法，同时运算时间少于PSOPF算法。

基于虚拟化技术的有效提高系统可用性的方法

李津津, 贾晓启, 杜海超, 王利朋

2017, 37(4): 986-992. DOI: 10.11772/j.issn.1001-9081.2017.04.0986

摘要 ( )

PDF (1122KB) ( )

参考文献 | 相关文章 | 计量指标

针对安全攸关的客户机在安全工具发生警报时往往会进行暂停、检测、恢复等操作，而安全工具误报（虚报、漏报）的发生和发现存在延迟，从而对客户机造成可用性影响的问题，提出一种基于虚拟化技术的有效解决方案。在误报发生时，首先正确控制可疑进程行为，避免该进程对系统造成实质性影响。其次记录可疑进程行为，并根据其与系统其他进程的交互行为形成进程间依赖关系。当误报被发现时，以记录的进程行为及进程间依赖关系为依据，对可疑进程及与其存在依赖关系的相关进程采取恢复进程行为、杀死相关进程等措施，使系统快速达到正确运行状态。实验结果表明，所提方案能够在安全工具发生误报时，避免回滚、恢复等操作带来的时间开销，相对于未采取措施的情况，所提方案将误报存在时的处理时间减少20%~50%。所提方案能够有效降低安全工具误报对客户机可用性造成的影响，可应用在安全攸关的客户机所在的云平台之上。

基于粗糙集的古典密码模型

汤建国, 汪江桦

2017, 37(4): 993-998. DOI: 10.11772/j.issn.1001-9081.2017.04.0993

摘要 ( )

PDF (901KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统古典密码虽然具备简洁高效的特性，但其在当前社会计算能力下极易被破解这一问题，提出一种利用粗糙集方法设计古典密码模型的算法。在该模型的构造中，首先充分融入粗糙集的确定性中蕴含着不确定性以及近似空间规模会随论域微增而急剧增大的特点，来弱化模型的统计规律；其次，借助混合同余法来提升模型产生随机序列的能力；最后，结合自定义运算和同余方法特性来让部分明文信息参与到加密过程中，进一步增强模型抗攻击的能力。研究分析表明，该模型不仅在时间和空间复杂度上与传统古典密码处于同一级别，而且具备了近乎理想的扩散与混淆性能，完全弥补了古典密码容易被破解的缺陷，能有效抵御穷举法和统计分析法的攻击。

支持安全多方同态乘积计算的谓词加密方案

李镇林, 张薇, 戴晓明

2017, 37(4): 999-1003. DOI: 10.11772/j.issn.1001-9081.2017.04.0999

摘要 ( )

PDF (746KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统安全多方计算（SMC）加密方案中，每一位参与者都能获知最终结果，这种粗粒度的访问控制不适用于要求特定用户对密文进行解密的问题，提出了对计算结果解密权限控制更精确的加密方案。通过与谓词加密相结合，构造了一种支持安全多方同态乘积计算的谓词加密方案，具有乘法同态性。与现有的谓词加密方案相比，该方案不仅支持同态操作，并且在对最终计算结果的解密权限上，该方案的控制更加精确。在当前云环境背景下，实现了对计算结果访问控制细粒度更高的安全多方计算，并且验证方案达到不可区分的属性隐藏抵抗选择明文攻击（IND-AH-CPA）安全。

基于加速度传感器的中文签名身份认证

刘威, 汪阳, 郑建彬, 詹恩奇

2017, 37(4): 1004-1007. DOI: 10.11772/j.issn.1001-9081.2017.04.1004

摘要 ( )

PDF (777KB) ( )

参考文献 | 相关文章 | 计量指标

采集用户在签名过程中的三轴加速度信息，可用来实现身份认证。中文签名结构较为复杂，在空中书写的过程难以被模仿，但同时也会使同一用户不同次签名间的差异增大，提高认证难度。传统的二维签名或三维手势认证方法并不能解决这一问题。为了提高中文空中签名身份认证效果，改进了全局序列对齐（GSA）算法，对匹配后的序列进行插值操作。不同于传统GSA算法通过最终匹配分数反映序列间相似度，引入两种距离指标（欧氏距离和绝对值距离）计算序列间的差异。实验结果表明，基于距离指标的两种GSA算法均能提高认证精度，与传统算法相比，二者的系统等误率（EER）分别降低了37.6%和52.6%。

基于并行约简的网络安全态势要素提取方法

赵冬梅, 李红

2017, 37(4): 1008-1013. DOI: 10.11772/j.issn.1001-9081.2017.04.1008

摘要 ( )

PDF (930KB) ( )

参考文献 | 相关文章 | 计量指标

网络安全态势要素选取的质量对网络安全态势评估的准确性起到至关重要的作用，而现有的网络安全态势要素提取方法大多依赖先验知识，并不适用于处理网络安全态势数据。为提高网络安全态势要素提取的质量与效率，提出一种基于属性重要度矩阵的并行约简算法，在经典粗糙集基础上引入并行约简思想，在保证分类不受影响的情况下，将单个决策信息表扩展到多个，利用条件熵计算属性重要度，根据约简规则删除冗余属性，从而实现网络安全态势要素的高效提取。为验证算法的高效性，利用Weka软件对数据进行分类预测，在NSL-KDD数据集中，相比利用全部属性，通过该算法约简后的属性进行分类建模的时间缩短了16.6%；对比评价指标发现，相比现有的三种态势要素提取算法（遗传算法（GA）、贪心式搜索算法（GSA）和基于条件熵的属性约简（ARCE）算法），该算法具有较高的召回率和较低的误警率。实验结果表明，经过该算法约简的数据具有更好的分类性能，实现了网络安全态势要素的高效提取。

基于动态可配置规则的数据清洗方法

朱会娟, 蒋同海, 周喜, 程力, 赵凡, 马博

2017, 37(4): 1014-1020. DOI: 10.11772/j.issn.1001-9081.2017.04.1014

摘要 ( )

PDF (1069KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统数据清洗方法通过硬编码方法来实现业务逻辑而导致系统的可重用性、可扩展性与灵活性较差等问题，提出了一种基于动态可配置规则的数据清洗方法——DRDCM。该方法支持多种类型规则间的复杂逻辑运算，并支持多种脏数据修复行为，集数据检测、数据修复与数据转换于一体，具有跨领域、可重用、可配置、可扩展等特点。首先，对DRDCM方法中的数据检测和数据修复的概念、实现步骤以及实现算法进行描述；其次，阐述了DRDCM方法中支持的多种规则类型以及规则配置；最后，对DRDCM方法进行实现，并通过实际项目数据集验证了该实现系统在脏数据修复中，丢弃修复行为具有很高的准确率，尤其是对需遵守法定编码规则的属性（例如身份证号码）处理时其准确率可达100%。实验结果表明，DRDCM实现系统可以将动态可配置规则无缝集成于多个数据源和多种不同应用领域且该系统的性能并不会随着规则条数增加而极速降低，这也进一步验证了DRDCM方法在真实环境中的切实可行性。

面向外包空间数据库的范围查询验证

胡晓燕, 王静宇, 李海荣

2017, 37(4): 1021-1025. DOI: 10.11772/j.issn.1001-9081.2017.04.1021

摘要 ( )

PDF (904KB) ( )

参考文献 | 相关文章 | 计量指标

针对空间范围查询验证方法（例如VR-tree和MR-tree）普遍存在验证对象（VO）中包含大量的节点验证信息，造成服务器到客户端的传输代价较大以及客户端验证效率较低等问题，提出一种新的验证索引结构（ADS）MGR-tree。首先利用拆分思想，通过在Grid-tree的叶子节点中嵌入R-tree，并结合Merkle哈希树的验证方法，极大地减小VO的大小，提高查询和验证的效率。在此基础上，利用Hilbert曲线降维的特性，构建了优化的索引结构MHGR-tree，并提出一种过滤策略，进一步提高验证的效率。实验结果表明，所提方法具有更好的表现。在最好情况下，MHGR的VO大小和验证时间仅为MR的63%和19%。

类属数据的贝叶斯聚类算法

朱杰, 陈黎飞

2017, 37(4): 1026-1031. DOI: 10.11772/j.issn.1001-9081.2017.04.1026

摘要 ( )

PDF (919KB) ( )

参考文献 | 相关文章 | 计量指标

针对类属型数据聚类中对象间距离函数定义的困难问题，提出一种基于贝叶斯概率估计的类属数据聚类算法。首先，提出一种属性加权的概率模型，在这个模型中每个类属属性被赋予一个反映其重要性的权重；其次，经过贝叶斯公式的变换，定义了基于最大似然估计的聚类优化目标函数，并提出了一种基于划分的聚类算法，该算法不再依赖于对象间的距离，而是根据对象与数据集划分间的加权似然进行聚类；第三，推导了计算属性权重的表达式，得出了类属型属性权重与其符号分布的信息熵成反比的结论。在实际数据和合成数据集上进行了实验，结果表明，与基于距离的现有聚类算法相比，所提算法提高了聚类精度，特别是在生物信息学数据上取得了5%~48%的提升幅度，并可以获得有实际意义的属性加权结果。

基于差异度的不均衡电信客户数据分类方法

王林, 郭娜娜

2017, 37(4): 1032-1037. DOI: 10.11772/j.issn.1001-9081.2017.04.1032

摘要 ( )

PDF (964KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统分类技术对不均衡电信客户数据集中流失客户识别能力不足的问题，提出一种基于差异度的改进型不均衡数据分类（IDBC）算法。该算法在基于差异度分类（DBC）算法的基础上改进了原型选择策略。在原型选择阶段，利用改进型的样本子集优化方法从整体数据集中选择最具参考价值的原型集，从而避免了随机选择所带来的不确定性；在分类阶段，分别利用训练集和原型集、测试集和原型集样本之间的差异性构建相应的特征空间，进而采用传统的分类预测算法对映射到相应特征空间内的差异度数据集进行学习。最后选用了UCI数据库中的电信客户数据集和另外6个普通的不均衡数据集对该算法进行验证，相对于传统基于特征的不均衡数据分类算法，DBC算法对稀有类的识别率平均提高了8.3%，IDBC算法对稀有类的识别率平均提高了11.3%。实验结果表明，所提IDBC算法不受类别分布的影响，而且对不均衡数据集中稀有类的识别能力优于已有的先进分类技术。

基于跨境电商可控关联性大数据的出口产品销量动态预测模型

王雪蓉, 万年红

2017, 37(4): 1038-1043. DOI: 10.11772/j.issn.1001-9081.2017.04.1038

摘要 ( )

PDF (1121KB) ( )

参考文献 | 相关文章 | 计量指标

目前流行的外贸产品销量预测方法单纯地分别从第三方平台或大数据角度研究预测问题，对互联网平台、跨境电商、大数据融合应用于产品销量动态演化预测的考虑不足。为提高出口产品销量预测效果，实现预测系统的伸缩性和动态演化性，基于研究"互联网+外贸"环境下跨境电商出口产品销量可控关联性大数据挖掘、个性化预测机制、智慧预测算法，改进分布式定量、集中式定性计算等相应算法，提出一个"互联网+外贸"驱动下基于跨境电商可控关联性大数据的出口产品销量动态预测模型，并进行了应用实验，对各种模型的实验结果进行对比分析。实验结果表明，该模型充分融合了"互联网+"的开放性、可延伸性和大数据动态预测优势，实现了"互联网+外贸"环境下基于跨境电商可控关联性大数据的出口产品销量动态、智慧、定量定性预测。该模型综合预测效果明显优于传统模型，具有较强的动态演化性和较高的实用价值。

融合规则与统计的微博新词发现方法

周霜霜, 徐金安, 陈钰枫, 张玉洁

2017, 37(4): 1044-1050. DOI: 10.11772/j.issn.1001-9081.2017.04.1044

摘要 ( )

PDF (1117KB) ( )

参考文献 | 相关文章 | 计量指标

结合微博新词的构词规则自由度大和极其复杂的特点，针对传统的C/NC-value方法抽取的结果新词边界的识别准确率不高，以及低频微博新词无法正确识别的问题，提出了一种融合人工启发式规则、C/NC-value改进算法和条件随机场（CRF）模型的微博新词抽取方法。一方面，人工启发式规则是指对微博新词的分类和归纳总结，并从微博新词构词的词性（POS）、字符类别和表意符号等角度设计的微博新词的构词规则；另一方面，改进的C/NC-value方法通过引入词频、邻接熵和互信息等统计量来重构NC-value目标函数，并使用CRF模型训练和识别新词，最终达到提高新词边界识别准确率和低频新词识别精度的目的。实验结果显示，与传统方法相比，所提出的方法能有效地提高微博新词识别的F值。

基于平行语料库的双语协同中文关系抽取

郭勃, 冯旭鹏, 刘利军, 黄青松

2017, 37(4): 1051-1055. DOI: 10.11772/j.issn.1001-9081.2017.04.1051

摘要 ( )

PDF (826KB) ( )

参考文献 | 相关文章 | 计量指标

针对在中文资源的关系抽取中，由于中文长句句式复杂，句法特征提取难度大、准确度低等问题，提出了一种基于平行语料库的双语协同中文关系抽取方法。首先在中英双语平行语料库中的英文语料上利用英文成熟的句法分析工具，将得到依存句法特征用于英文关系抽取分类器的训练，然后与利用适合中文的n-gram特征在中文语料上训练的中文关系抽取分类器构成双语视图，最后再依靠标注映射后的平行语料库，将彼此高可靠性的语料加入对方训练语料进行双语协同训练，最终得到一个性能更好的中文关系抽取分类模型。通过对中文测试语料进行实验，结果表明该方法提高了基于弱监督方法的中文关系抽取性能，其F值提高了3.9个百分点。

融合《知网》和搜索引擎的词汇语义相似度计算

张硕望, 欧阳纯萍, 阳小华, 刘永彬, 刘志明

2017, 37(4): 1056-1060. DOI: 10.11772/j.issn.1001-9081.2017.04.1056

摘要 ( )

PDF (844KB) ( )

参考文献 | 相关文章 | 计量指标

针对当前《知网》的词语语义描述与人们对词汇的主观认知之间存在诸多不匹配的问题，在充分利用丰富的网络知识的背景下，提出了一种融合《知网》和搜索引擎的词汇语义相似度计算方法。首先，考虑了词语与词语义原之间的包含关系，利用改进的概念相似度计算方法得到初步的词语语义相似度结果；然后，利用基于搜索引擎的相关性双重检测算法和点互信息法得出进一步的语义相似度结果；最后，设计了拟合函数并利用批量梯度下降法学习权值参数，融合前两步的相似度计算结果。实验结果表明，与单纯的基于《知网》和基于搜索引擎的改进方法相比，融合方法的斯皮尔曼系数和皮尔逊系数均提升了5%，同时提升了具体词语义描述与人们对词汇的主观认知之间的匹配度，验证了将网络知识背景融入到概念相似度计算方法中能有效提高中文词汇语义相似度的计算性能。

基于潜语义主题加强的跨媒体检索算法

黄育, 张鸿

2017, 37(4): 1061-1064. DOI: 10.11772/j.issn.1001-9081.2017.04.1061

摘要 ( )

PDF (732KB) ( )

参考文献 | 相关文章 | 计量指标

针对不同模态数据对相同语义主题表达存在差异性，以及传统跨媒体检索算法忽略了不同模态数据能以合作的方式探索数据的内在语义信息等问题，提出了一种新的基于潜语义主题加强的跨媒体检索（LSTR）算法。首先，利用隐狄利克雷分布（LDA）模型构造文本语义空间，然后以词袋（BoW）模型来表达文本对应的图像；其次，使用多分类逻辑回归对图像和文本分类，用得到的基于多分类的后验概率表示文本和图像的潜语义主题；最后，利用文本潜语义主题去正则化图像的潜语义主题，使图像的潜语义主题得到加强，同时使它们之间的语义关联最大化。在Wikipedia数据集上，文本检索图像和图像检索文本的平均查准率为57.0%，比典型相关性分析（CCA）、SM（Semantic Matching）、SCM（Semantic Correlation Matching）算法的平均查准率分别提高了35.1%、34.8%、32.1%。实验结果表明LSTR算法能有效地提高跨媒体检索的平均查准率。

基于弹幕情感分析的视频片段推荐模型

邓扬, 张晨曦, 李江峰

2017, 37(4): 1065-1070. DOI: 10.11772/j.issn.1001-9081.2017.04.1065

摘要 ( )

PDF (1074KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统的视频情感分析方法计算效率较低且结果不易解释等问题，提出一种基于弹幕文本的视频片段情感识别算法，并以此作为视频片段的推荐依据。首先对基于情感分析的视频片段推荐问题提出形式化描述。其次，通过构建基于隐含狄利克雷分布（LDA）的弹幕词语分类，评估弹幕词语在视频片段中的多维情感向量，同时，根据视频片段之间的情感依赖关系推荐视频的情感片段。所提方法的推荐准确度比基于词频-逆文档频率（TF-IDF）的推荐算法提高了28.9%，相对于传统LDA模型提高了43.8%。实验结果表明所提模型可有效应用于信息繁杂的不规则文本情感分析。

稀疏约束图正则非负矩阵分解的增量学习算法

汪金涛, 曹玉东, 孙福明

2017, 37(4): 1071-1074. DOI: 10.11772/j.issn.1001-9081.2017.04.1071

摘要 ( )

PDF (632KB) ( )

参考文献 | 相关文章 | 计量指标

针对非负矩阵分解后数据的稀疏性降低、训练样本增多导致运算规模不断增大的现象，提出了一种稀疏约束图正则非负矩阵分解的增量学习算法。该方法不仅考虑数据的几何信息，而且对系数矩阵进行稀疏约束，并将它们与增量学习相结合。算法在稀疏约束和图正则化的条件下利用上一步的分解结果参与迭代运算，在节省大量运算时间的同时提高了分解后数据的稀疏性。在ORL和PIE人脸数据库上的实验结果表明了该算法的有效性。

基于LDA主题模型的移动应用相似度构建方法

褚征, 于炯, 王佳玉, 王跃飞

2017, 37(4): 1075-1082. DOI: 10.11772/j.issn.1001-9081.2017.04.1075

摘要 ( )

PDF (1175KB) ( )

参考文献 | 相关文章 | 计量指标

随着移动互联网的快速发展，如何从大量的移动应用中抽取有效的描述信息继而为移动用户提供有效准确的推荐策略变得尤为迫切。目前，移动应用市场对应用的推荐策略相对传统，大多是根据应用的单一属性进行推荐，如下载量、应用名称、应用分类等。针对推荐粒度过粗和推荐不准确的问题，提出了一种基于潜在狄利克雷分布（LDA）主题模型的移动应用相似度构建方法。该方法从应用的标签入手，构造应用的主题模型分布矩阵，利用该主题分布矩阵构建移动应用的相似度矩阵，同时提出了将移动应用相似度矩阵转化为可行的存储结构的方法。实验结果表明该方法是有效的，相比现有的360应用市场推荐的应用其相似度提升130%。该方法解决了移动应用推荐过程中推荐粒度过粗的问题，可使推荐结果更加准确。

基于节点亲密度和影响力的社交网络舆论形成模型

张亚楠, 孙士保, 张京山, 尹立航, 闫晓龙

2017, 37(4): 1083-1087. DOI: 10.11772/j.issn.1001-9081.2017.04.1083

摘要 ( )

PDF (778KB) ( )

参考文献 | 相关文章 | 计量指标

针对舆论传播过程中个体交互的广泛性和个体社会影响力的差异性，在Hegselmann-Krause模型的基础上建立了社交网络舆论形成模型。新模型通过引入个体间亲密度、人际相似性和交互强度等概念，对个体交互集合进行了扩展，并对影响力权重进行了合理量化，进而构建更切合实际的观点交互规则。通过一系列仿真实验，分析了模型主要参数在舆论演化中的作用。结果表明：在不同信任阈值下，群体观点均能收敛到一致，形成舆论共识；且信任阈值越大，收敛时间越短；当信任阈值为0.2时，收敛时间仅为10。同时，扩大交互集合、提高人际相似性的作用强度会促进舆论共识的形成。此外，当无标度网络的聚类系数和平均度较高时，群体观点更容易产生趋同效应。研究结果有助于理解舆论形成的动力学过程，对社会管理者进行决策分析具有指导作用。

混沌云模型多目标布谷鸟搜索算法

马艺元, 宋卫平, 宁爱平, 牛海帆

2017, 37(4): 1088-1092. DOI: 10.11772/j.issn.1001-9081.2017.04.1088

摘要 ( )

PDF (722KB) ( )

参考文献 | 相关文章 | 计量指标

针对多目标布谷鸟搜索算法（MOCS）迭代后期寻优速度慢，并且容易造成局部最优等缺点，提出一种混沌云模型多目标布谷鸟搜索算法（CCMMOCS）。首先在进化过程中通过混沌理论对一般的布谷鸟巢位置在全局中寻求优化，以防落入局部最优；然后利用云模型对较好的布谷鸟巢位置局部优化来提高精度；最后将两种方法对比得到相对更好的解作为最优值以完成优化。对比误差估计值及多样性指标，由5个常用多目标测试函数仿真结果可知，CCMMOCS比传统多目标布谷鸟搜索算法、多目标粒子群算法（MOPSO）及多目标遗传（NSGA-Ⅱ）算法性能更好，Pareto前沿更接近理想曲线，分布也更均匀。

基于反向学习的跨种群差分进化算法

张斌, 李延晖, 郭昊

2017, 37(4): 1093-1099. DOI: 10.11772/j.issn.1001-9081.2017.04.1093

摘要 ( )

PDF (1001KB) ( )

参考文献 | 相关文章 | 计量指标

针对差分进化（DE）算法存在的寻优精度低、收敛速度慢等问题，借鉴混沌分散策略、反向学习策略（OBL）以及跨种群并行机制，提出一种基于反向学习的跨种群差分进化算法（OLCPDE）。采用混沌分散策略进行种群初始化，将种群划分为精英种群和普通种群，对两个子种群分别采用标准的差分进化策略和基于反向学习的差分进化策略；同时，为进一步提高算法对单峰函数的求解精度和稳定性，采用了一种跨种群的差分进化策略，运用三种策略对子种群进行操作，达到共同进化的目的。实验独立运行30次，OLCPDE在12个标准的测试函数中，有11个函数都能稳定地收敛到全局最优解，优于对比算法。实验结果表明，OLCPDE收敛精度高，能有效避免陷入局部最优点。

基于实例的强分类器快速集成方法

许业旺, 王永利, 赵忠文

2017, 37(4): 1100-1104. DOI: 10.11772/j.issn.1001-9081.2017.04.1100

摘要 ( )

PDF (764KB) ( )

参考文献 | 相关文章 | 计量指标

针对集成分类器由于基分类器过弱，需要牺牲大量训练时间才能取得高精度的问题，提出一种基于实例的强分类器快速集成方法——FSE。首先通过基分类器评价方法剔除不合格分类器，再对分类器进行精确度和差异性排序，从而得到一组精度最高、差异性最大的分类器；然后通过FSE集成算法打破已有的样本分布，重新采样使分类器更多地关注难学习的样本，并以此决定各分类器的权重并集成。实验通过与集成分类器Boosting在UCI数据库和真实数据集上进行比对，Boosting构造的集成分类器的识别精度最高分别能达到90.2%和90.4%，而使用FSE方法的集成分类器精度分别能达到95.6%和93.9%；而且两者在达到相同精度时，使用FSE方法的集成分类器分别缩短了75%和80%的训练时间。实验结果表明，FSE集成模型能有效提高识别精度、缩短训练时间。

基于元学习推荐的优化算法自动选择框架与实证分析

崔建双, 刘晓婵, 杨美华, 李雯燕

2017, 37(4): 1105-1110. DOI: 10.11772/j.issn.1001-9081.2017.04.1105

摘要 ( )

PDF (1014KB) ( )

参考文献 | 相关文章 | 计量指标

算法选择的目的是从众多可用优化算法中自动地选出最适用于当前问题的算法。针对算法选择问题提出了基于元学习推荐的优化算法自动选择框架。依据此框架，以多模式资源受限的项目调度问题为实证数据集，设计实现了遗传算法（GA）、粒子群算法（PSO）和模拟退火算法（SA）三种算法的自动选择过程。从项目调度问题数据库中随机选取了378个问题算例，提取其中的固有特征和统计特征作为元数据，并利用前馈型神经网络（FNN）算法训练获得用于预测的元模型对未见算例作出预测。实证结果表明两选一的算法预测准确率最高可超过95%，交叉验证准确率平均达到85%；三选一的算法预测准确率最高可达92%，交叉验证准确率平均超过80%。实证结果验证了所提算法选择框架是成功的，基于元学习思想的优化算法自动选择方法是可行的。

基于Mel子带参数化特征的自动鸟鸣识别

张赛花, 赵兆, 许志勇, 张怡

2017, 37(4): 1111-1115. DOI: 10.11772/j.issn.1001-9081.2017.04.1111

摘要 ( )

PDF (780KB) ( )

参考文献 | 相关文章 | 计量指标

针对自然复杂声学环境下基于鸟鸣的物种分类问题，提出了一种基于Mel子带参数化特征的鸟鸣自动识别方法。采用高斯混合模型（GMM）拟合连续声学监测数据分帧后的对数能量分布，选取高似然率的数据帧组成候选声音事件完成自动分段。在谱图域对相应片段采用Mel带通滤波器组滤波处理，然后基于自回归模型（AR）分别建模各个子带输出的随时间变化的能量序列，得到能够描述不同种类鸟鸣信号时频特性的参数化特征。最后利用支持向量机（SVM）分类器进行分类识别。基于野外自然环境11种鸟鸣信号开展了自动分段与识别实验，所提方法针对各类鸟鸣的查准率、查全率以及F1度量均不低于89%，明显优于现有基于纹理特征的方法，更适用于野外鸟类连续声学监测领域的自动数据分析需求。

基于路径跟踪控制方法的拖挂式机器人系统路径规划算法

方晓波, 钱宏, 刘朕明, 孟德壮

2017, 37(4): 1116-1121. DOI: 10.11772/j.issn.1001-9081.2017.04.1116

摘要 ( )

PDF (868KB) ( )

参考文献 | 相关文章 | 计量指标

为解决拖挂式移动机器人系统路径规划算法精准性低、稳定性差和无法考虑系统间安全性等的问题，提出一种基于路径跟踪方法的路径规划算法。该算法融合快速拓展随机树（RRT）基本算法和路径跟踪控制方程，通过自动拟合样条曲线，跟踪并生成节点间轨迹，以此提高路径精准性；加入系统夹角约束条件和节点击中机制提高算法稳定性和结果安全性；此外，加入贪心优化算法，针对结果路径进行优化处理。通过仿真实验结果表明，相较基本RRT算法，改进算法搜索得到的路径更贴近实际运动轨迹，在安全性和成功率上优于原算法，能够满足快速设计或实时系统的需求。

改进扩展卡尔曼滤波的四旋翼姿态估计算法

王龙, 章政, 王立

2017, 37(4): 1122-1128. DOI: 10.11772/j.issn.1001-9081.2017.04.1122

摘要 ( )

PDF (1094KB) ( )

参考文献 | 相关文章 | 计量指标

为了提高标准扩展卡尔曼姿态估计算法的精确度和快速性，将运动加速度抑制的动态步长梯度下降算法融入扩展卡尔曼中，提出一种改进扩展卡尔曼的四旋翼姿态估计算法。该算法在卡尔曼测量更新中采用梯度下降法进行非线性观测，消除标准扩展卡尔曼算法在线性化时带来的线性化误差，提高算法的准确性和快速性；对梯度下降法的梯度步长进行动态处理，使算法步长与四旋翼飞行器的运动合角速度成正比，增强微型四旋翼飞行器姿态解算的动态性能；对强机动运动过程中机体产生的运动加速度进行抑制处理，消除运动加速度对姿态解算的不利影响，提高了微型四旋翼飞行器姿态解算的跟踪精度。为了验证所设计算法的可行性和有效性，基于STM32单片机搭建四旋翼实验平台系统进行实时在线性能验证。结果表明，所设计算法能提高四旋翼飞行器在强机动、高速运动情况下的姿态跟踪精度、动态性能，增强姿态融合算法的抗干扰性，保证微型四旋翼飞行器的稳定飞行。

针对Android资源泄漏的基准测试集的构造与评测

刘洁瑞, 巫雪青, 严俊, 杨红丽

2017, 37(4): 1129-1134. DOI: 10.11772/j.issn.1001-9081.2017.04.1129

摘要 ( )

PDF (1015KB) ( )

参考文献 | 相关文章 | 计量指标

Android系统是目前最受欢迎的开放手机操作系统，然而高度的开放性也引来了许多问题，资源泄漏就是其中普遍存在的一个。对于Android系统出现的资源泄漏以及没有基于该漏洞的基准测试集被提出的问题，构造出了一套针对Android资源泄漏的基准测试集ResLeakBench。首先，参考Android官方文档以及观察大量的真实Android应用，整理出了Android程序中使用的资源操作以及它们常用的使用场景。然后，根据整理的信息自主构造了35个基准测试程序；另外，收集了35个资源使用相关的真实开源程序作为基准测试程序来保证测试集的实用性。最后，利用ResLeakBench对资源泄漏检测工具Relda2以及资源泄漏修复工具RelFix进行了有效性评测，发现了Relda2以及RelFix工具存在的问题。实验结果表明ResLeakBench针对资源泄漏问题是一套实用的基准测试集。

克隆代码有害性预测中的特征选择模型

王欢, 张丽萍, 闫盛, 刘东升

2017, 37(4): 1135-1142. DOI: 10.11772/j.issn.1001-9081.2017.04.1135

摘要 ( )

PDF (1468KB) ( )

参考文献 | 相关文章 | 计量指标

为解决克隆代码有害性预测过程中特征无关与特征冗余的问题，提出一种基于相关程度和影响程度的克隆代码有害性特征选择组合模型。首先，利用信息增益率对特征数据进行相关性的初步排序；然后，保留相关性排名较高的特征并去除其他无关特征，减小特征的搜索空间；接着，采用基于朴素贝叶斯等六种分类器分别与封装型序列浮动前向选择算法结合来确定最优特征子集。最后对不同的特征选择方法进行对比分析，将各种方法在不同选择准则上的优势加以利用，对特征数据进行分析、筛选和优化。实验结果表明，与未进行特征选择之前对比发现有害性预测准确率提高15.2~34个百分点以上；与其他特征选择方法比较，该方法在F1测度上提高1.1~10.1个百分点，在AUC指标上提升达到0.7~22.1个百分点，能极大地提高有害性预测模型的准确度。

针对JavaScript浏览器兼容性的变异测试方法

程勇, 秦丹, 杨光

2017, 37(4): 1143-1148. DOI: 10.11772/j.issn.1001-9081.2017.04.1143

摘要 ( )

PDF (1031KB) ( )

参考文献 | 相关文章 | 计量指标

针对JavaScript浏览器兼容性问题缺乏有效的测试方法的问题，基于变异测试技术，对Web应用程序中的JavaScript语言在主流浏览器中的兼容性进行了分析，设计了18个针对浏览器兼容性错误的变异算子并开发了自动化的测试工具Compatibility Mutator。该程序使用抽象语法树（AST）分析JavaScript语法，使用Selenium WebDriver自动调用多个浏览器核心并行执行变异测试。通过对7个广泛使用的JavaScript框架的实验，验证了此方法对每一个框架都能够生成一定数量的变异体，其中对jQuery和YUI框架的变异测试的变异得分分别为43.06%和7.69%，表明了所设计的变异算子能够触发浏览器兼容性方面的错误，并且能够评估测试用例集的完备性。

基于逻辑区间热度的NAND闪存垃圾回收算法

雷兵兵, 严华

2017, 37(4): 1149-1152. DOI: 10.11772/j.issn.1001-9081.2017.04.1149

摘要 ( )

PDF (808KB) ( )

参考文献 | 相关文章 | 计量指标

针对现有的NAND闪存垃圾回收算法中回收性能不高，磨损均衡效果差，并且算法内存开销大的问题，提出了一种基于逻辑区间热度的垃圾回收算法。该算法重新定义了热度计算公式，把连续逻辑地址的NAND内存定义为一个热度区间，以逻辑区间的热度来代替逻辑页的热度，并将不同热度的数据分开存储到不同擦除次数的闪存块上，有效地实现了数据冷热分离，并且节约了内存空间。同时，算法还构造了一种新的回收代价函数来选择回收块，在考虑回收效率的同时，还兼顾了磨损均衡的问题。实验结果表明，该算法与性能优异的FaGC算法相比，总的擦除次数减少了11%，总的拷贝次数减少了13%，擦次数最大差值减少了42%，内存消耗能减少了75%。因此，该算法有利于增加闪存可用空间，改善闪存系统的读写性能，延长闪存使用寿命。

基于数据截获和欺骗式注入的通用记录重演方法

姚小强, 刘昌云, 郭相科

2017, 37(4): 1153-1156. DOI: 10.11772/j.issn.1001-9081.2017.04.1153

摘要 ( )

PDF (658KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统记录重演方法存在同报文格式相关、需要被控程序紧密配合及数据传输效率低等问题，提出了一种基于数据截获与欺骗方式实现的通用记录重演解决方案。首先，利用Winsock2 服务提供者接口技术，实现了网络数据的自动截获；其次，采用内存映射文件技术解决了数据共享和高速存取问题；最后通过向用户程序发送伪消息激发其读数据动作，完成数据注入。实际应用表明，新方法避免了数据的网络传输，无需被重演程序配合且与系统报文无关，能够完成10倍速度的流畅重演，普适于分布式仿真与模拟训练系统。

基于消息通信的分布式系统最终一致性平台

徐进, 黄勃, 冯炯

2017, 37(4): 1157-1163. DOI: 10.11772/j.issn.1001-9081.2017.04.1157

摘要 ( )

PDF (1141KB) ( )

参考文献 | 相关文章 | 计量指标

在分布式系统中为了满足高性能和吞吐量，一般采用异步消息通信方式，但消息通信没有解决分布式事务不一致问题。针对这个问题，提出建立一致性保障平台，通过这个平台实现最终一致性。首先，使系统满足幂等性以及业务数据与消息生产消费记录强一致性；其次，建立消息监控机制，根据监控规则和消费生产消费记录，判定消息正常还是需要补偿操作或者幂等操作，从而保证分布式系统基于消息通信的最终一致；最后，在整个设计实现过程中采用关注点分离和横向切分的思想与工程化的方法，实现一致性保障平台。通过实验和分析证明比较得出，与异步消息通信相比，分布式消息通信性能更优越；一致性保障平台能及时发现不一致并由系统及时处理，实现最终一致，即可以完全保障系统最终一致性；而且该平台通过平台化的实现方式在应用中可以快速复用到数十个业务系统。由此得出一致性保障平台可以解决分布式交易系统事务最终一致性问题，不仅性能优越而且经济。

基于目标域局部近邻几何信息的域自适应图像分类方法

唐宋, 陈利娟, 陈志贤, 叶茂

2017, 37(4): 1164-1168. DOI: 10.11772/j.issn.1001-9081.2017.04.1164

摘要 ( )

PDF (799KB) ( )

参考文献 | 相关文章 | 计量指标

在许多实际工程应用中，训练场景（源域）和测试场景（目标域）的分布并不相同，如果将源域中训练的分类器直接应用到目标域，性能往往会出现大幅度下降。目前大多数域自适应方法以概率推导为基础。从图像特征表达的角度出发，针对自适应图像分类问题，提出一种新的基于协同特征的无监督方法。首先，所有源样本被作为字典；然后，距离目标样本最近的三个目标域样本被用来帮助鲁棒地表达局部近邻几何信息；最后，结合字典和局部近邻信息实现编码，并利用最近邻分类器完成分类。因为协同特征通过融合目标域局部近邻信息，获得了更强的鲁棒性和区分性，基于该特征编码的分类方法具有更好的分类性能。在域自适应数据集上的对比实验结果表明所提算法是有效的。

基于自适应相似组稀疏表示的图像修复算法

林金勇, 邓德祥, 颜佳, 林晓英

2017, 37(4): 1169-1173. DOI: 10.11772/j.issn.1001-9081.2017.04.1169

摘要 ( )

PDF (827KB) ( )

参考文献 | 相关文章 | 计量指标

针对图像修复结果中存在的结构连续性和纹理清晰性较差的问题，提出了一种基于自适应相似组的图像修复算法。区别于传统的以单一图像块或固定数目图像块作为修复单元的方法，该算法根据自然图像中纹理区和结构区的不同特点，自适应地选取不同数目的相似图像块，构造自适应相似组；然后以相似组作为基本单元，学习自适应字典，并构造基于稀疏表示的图像修复模型；最后，采用Split Bregman Iteration算法高效地求解目标代价函数。实验结果表明，与基于图像块的图像修复算法和图像块组稀疏表示（GSR）算法相比，该算法在峰值信噪比（PSNR）上平均提高了0.94~4.34 dB，在结构相似性指数（SSIM）上平均提高了0.0069~0.0345，同时，修复速度分别是对比算法的2.51倍和3.32倍。

基于并列卷积神经网络的超分辨率重建

欧阳宁, 曾梦萍, 林乐平

2017, 37(4): 1174-1178. DOI: 10.11772/j.issn.1001-9081.2017.04.1174

摘要 ( )

PDF (843KB) ( )

参考文献 | 相关文章 | 计量指标

为提取更多有效特征并提高模型训练的收敛速度，提出一种基于并列卷积神经网络的超分辨率重建方法。该网络由两路不同结构的网络组成：一路为简单的残差网络，其优化残差映射比原始的映射更容易实现；另一路为增加了非线性映射的卷积神经网络，增强了网络的非线性能力。随着并行网络结构的复杂化，收敛速度慢成为突出问题。针对这个问题，在卷积层后添加正则化处理，以简化模型参数、增强特征拟合能力，最终达到加快收敛的目的。实验结果表明，与基于深度卷积神经网络算法相比，该网络结构收敛速度更快，主观视觉效果更好，峰值信噪比（PSNR）平均提高了0.2 dB。

基于多特征融合的深度视频自然语言描述方法

梁锐, 朱清新, 廖淑娇, 牛新征

2017, 37(4): 1179-1184. DOI: 10.11772/j.issn.1001-9081.2017.04.1179

摘要 ( )

PDF (999KB) ( )

参考文献 | 相关文章 | 计量指标

针对计算机对视频进行自动标注和描述准确率不高的问题，提出一种基于多特征融合的深度视频自然语言描述的方法。该方法提取视频帧序列的空间特征、运动特征、视频特征，进行特征的融合，使用融合的特征训练基于长短期记忆（LSTM）的自然语言描述模型。通过不同的特征组合训练多个自然语言描述模型，在测试时再进行后期融合，即先选择一个模型获取当前输入的多个可能的输出，再使用其他模型计算当前输出的概率，对这些输出的概率进行加权求和，取概率最高的作为输出。此方法中的特征融合的方法包括前期融合：特征的拼接、不同特征对齐加权求和；后期融合：不同特征模型输出的概率的加权融合，使用前期融合的特征对已生成的LSTM模型进行微调。在标准测试集MSVD上进行实验，结果表明：融合不同类型的特征方法能够获得更高评测分值的提升；相同类型的特征融合的评测结果不会高于单个特征的分值；使用特征对预训练好的模型进行微调的方法效果较差。其中使用前期融合与后期融合相结合的方法生成的视频自然语言描述得到的METEOR评测分值为0.302，比目前查到的最高值高1.34%，表明该方法可以提升视频自动描述的准确性。

人脸识别中基于学习的核图像微分滤波器

房贻广, 刘武, 张骥, 张令臣, 袁玫瑰, 屈磊

2017, 37(4): 1185-1188. DOI: 10.11772/j.issn.1001-9081.2017.04.1185

摘要 ( )

PDF (767KB) ( )

参考文献 | 相关文章 | 计量指标

针对人脸识别应用，提出一种基于学习且具有鉴别能力的核图像微分滤波器。首先，区别于现有滤波器的手工设计方法，该滤波器利用训练集动态学习获得，通过在学习过程中融入线性判别分析（LDA）思想，可在增加滤波后图像类内相似度的同时减小类间相似度；其次，在线性滤波分类器的基础上进一步引入二阶微分信息，并结合核方法在高维空间下进行滤波器学习，使得图像中的细节和非线性信息可以得到更好的利用并获得更具鉴别力的特征描述。AR和ORL人脸库上的多组对比实验结果表明，与线性可学习图像滤波器IFL、不考虑微分信息的核图像滤波器以及只考虑一阶微分信息的核图像滤波器进行比较，所提算法可有效提高识别性能。

基于图割理论的尺度自适应人脸跟踪算法

胡章芳, 秦阳鸿

2017, 37(4): 1189-1192. DOI: 10.11772/j.issn.1001-9081.2017.04.1189

摘要 ( )

PDF (665KB) ( )

参考文献 | 相关文章 | 计量指标

针对连续自适应的Mean-Shift（Camshift）算法跟踪人脸时尺度过度放缩这一问题，提出了一种基于图割的Camshift人脸跟踪算法。首先，在每一帧图像的Camshift迭代结果内建立图割区域，使用高斯肤色模型作为图割权值分割出图割区域内肤色团块；然后，计算该肤色团大小得到目标真实尺度，并比较与上一帧图像跟踪框内肤色团的尺度来判断是否需要重新跟踪目标；最后，再以该团块作为下一帧跟踪目标。实验结果表明，基于图割的Camshift人脸跟踪算法有效地克服了跟踪时其他肤色区域的干扰，能有效地反映人体快速运动中人脸真实尺度变化，同时防止Camshift算法丢失跟踪目标而陷入局部最优解，具有较好的可用性和鲁棒性。

基于自适应切空间的MRI图像配准

刘薇, 陈雷霆

2017, 37(4): 1193-1197. DOI: 10.11772/j.issn.1001-9081.2017.04.1193

摘要 ( )

PDF (775KB) ( )

参考文献 | 相关文章 | 计量指标

微分同胚是一种光滑可逆的变换，在MRI图像配准中可以保证图像形变后的拓扑结构保持不变，同时避免出现不合理的物理现象。为了在空间变换中获得更合理的同胚映射，高维空间中数据的非线性结构被考虑，基于流形学习方法提出一种自适应切空间的MRI图像配准算法。首先，把MRI数据构造成对称正定（SPD）的协方差矩阵，然后形成李群；接着，利用样本点邻域的局部切空间来表示李群的几何结构的非线性；接下来，在流形上用自适应邻域选择的方法形成的线性子空间去逼近局部切空间，提高切空间的局部线性化程度，从而最大限度地保留流形的局部非线性结构，得到最优的同胚映射。仿真数据和临床数据的实验结果显示，与传统的非参数微分同胚配准算法相比，该算法在高维稠密形变场上获得更高的拓扑保持度，最终提高图像配准精度。

基于D-S证据理论的室内组合定位算法

王续乔, 王瑾琨

2017, 37(4): 1198-1201. DOI: 10.11772/j.issn.1001-9081.2017.04.1198

摘要 ( )

PDF (762KB) ( )

参考文献 | 相关文章 | 计量指标

在非定位系统部署信标的大体量场区环境下，针对基于位置的服务（LBS）的室内定位需求问题，提出了一种基于D-S证据推理理论的无线局域网/惯性测量组件（WiFi/IMU）组合定位算法。该算法首先建立各接入点（AP）单点的信号强度传输模型，并利用卡尔曼滤波对接收到的信号强度指示（RSSI）值进行去噪修正处理；然后通过D-S证据理论对实时采集的WiFi信号强度、偏航角、各轴加速度的多源信息进行融合处理，选取可信度高的指纹区块；最后通过加权K近邻（WKNN）算法得到终端估算位置。单元场区仿真实验结果显示，最大误差2.36 m，综合平均误差1.27 m，验证了该算法的可行性与有效性；且误差累计概率分布在小于等于典型距离时为88.20%，优于惩罚参数C支持向量回归机（C-SVR）的70.82%和行人航迹推算（PDR）算法的67.85%。进一步地，算法在全场区实际实验中也表现出了良好的环境适用性。

改进灰狼算法在土壤墒情监测预测系统中的应用

李宁, 李刚, 邓中亮

2017, 37(4): 1202-1206. DOI: 10.11772/j.issn.1001-9081.2017.04.1202

摘要 ( )

PDF (783KB) ( )

参考文献 | 相关文章 | 计量指标

针对现有的固定端传感器土壤墒情监测预测系统架设成本高、传感器易损坏、预测精度较低等问题，设计并实现了基于非固定无线传感器组网与改进灰狼算法优化神经网络的土壤墒情监测预测系统。系统使用非固定即插即用式传感器蓝牙组网收集墒情数据，使用高精度多源定位接入融合方法进行广域室外高精度定位。在算法方面，针对灰狼算法在迭代中后期易陷入局部最优等问题，提出一种基于末尾探索者策略的改进灰狼算法。首先，根据种群个体适应度值排名，在原有算法个体类型中增加探索者类型。然后，将种群搜索分为三个时期：活跃探索期、周期探索期和种群回归期。最后，在每个时期使用特有的位置更新策略进行探索者位置调整，使得算法在探索初期更具随机性，在探索中后期依然保持一定的解空间搜索能力，从而增强算法的局部最优回避能力。使用标准函数进行算法性能测试，并将该算法应用于优化土壤墒情神经网络预测模型问题，使用某市2号试验田的数据进行实验。实验结果表明，所提算法与直接神经网络预测模型相比，相对误差下降约4个百分点；与传统灰狼算法、粒子群优化（PSO）算法优化模型比较，相对误差下降约1至2个百分点。所提算法拥有更小的误差，更好的局部最优回避能力，能有效提高墒情的预测质量。

基于可视化异类特征优选融合的滚动轴承故障诊断

杨洪柏, 张宏利, 刘树林

2017, 37(4): 1207-1211. DOI: 10.11772/j.issn.1001-9081.2017.04.1207

摘要 ( )

PDF (821KB) ( )

参考文献 | 相关文章 | 计量指标

针对故障诊断过程中基于简单的多类故障特征联合决策存在特征集维数多、数据冗余、故障识别率不高的缺点，提出了一种基于异类特征优选融合的故障诊断方法。该方法根据多类特征数据的轮廓图，分析各维特征数据的聚类特性，去除聚类性弱、对故障区分无益的冗余特征维度，仅保留聚类性强的特征维度用于故障识别。在轴承故障诊断实验中，选用故障信号时域统计量和小波包能量两类多维特征进行优选融合，并采用反向传播（BP）神经网络进行故障模式识别。故障识别率达到100%，显著高于无特征优选的故障诊断方法。实验结果表明所提出的方法简便易行，可以显著提高故障识别率。

改进的变步长最小均方误差电子耳蜗语音增强算法

徐文超, 王光艳, 陈雷

2017, 37(4): 1212-1216. DOI: 10.11772/j.issn.1001-9081.2017.04.1212

摘要 ( )

PDF (799KB) ( )

参考文献 | 相关文章 | 计量指标

针对外部强噪声环境下电子耳蜗语音质量受损、适应性差等问题，提出了基于谱减法和变步长最小均方误差（LMS）自适应滤波算法联合去噪的改进方法，并以该方法构建了一个电子耳蜗前端语音预处理系统。利用变步长LMS自适应滤波算法输出误差的平方项来调节步长，采用步长值固定与变化相结合的方法，解决了自适应滤波算法收敛速度慢、稳态误差大的问题，适应性得到提高，提高了语音信号通信质量。该系统以TMS320VC5416和音频编解码芯片TLV320AIC23B为核心，通过多通道缓冲串口（McBSP）和串行外设接口（SPI）实现了语音数据的高速采集和实时处理。实验仿真和测试结果表明该算法消除噪声性能好，信噪比在低输入信噪比情况下提高约10 dB，语音质量感知评价（PESQ）分值也得到较大提高，能有效提高语音信号质量，且该系统性能稳定，能进一步提高耳蜗前端语音的清晰度和可懂度。

当期目录