当期目录

    2014年 第34卷 第8期 刊出日期:2014-08-01
    第五届中国数据挖掘会议(CCDM 2014)论文
    面向无线传感器网络的自适应数据清洗方法
    夏英 毕海洋 雷建军 裵海英
    2014, 34(8):  2145-2147.  DOI: 10.11772/j.issn.1001-9081.2014.08.2145
    摘要 ( )   PDF (619KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对无线传感器网络(WSN)数据不精确和不可靠的问题,根据感知数据的空间相关性定义了弹性空间模型,并在此基础上提出一种自适应近邻空间清洗方法(ANSA)。该方法根据感知数据波动动态调整近邻空间大小,并通过计算近邻节点测量数据的加权平均对本地数据清洗。实验结果表明,感知数据清洗后误差控制在0.5以内,与经典的加权移动平均(WMA)方法相比,所提方法的精确度更高,同时能量损耗减少约36%。

    基于LEACH的无线传感器网络混合优化协议算法
    沈梦南 耿生玲 刘震
    2014, 34(8):  2148-2154.  DOI: 10.11772/j.issn.1001-9081.2014.08.2148
    摘要 ( )   PDF (1057KB) ( )  
    参考文献 | 相关文章 | 计量指标

    在无线传感器网络(WSN)协议研究中,降低节点的能量损耗、延长节点的使用寿命是研究的关键问题。针对无线传感器网络中传统LEACH协议在分簇机制及数据通信方面的不足,提出了一种混合优化的改进协议——HOBDE-LEACH。新的协议采用先分簇再选举簇头的策略,提出覆盖半径种子扫描成簇算法(CR-SSCA)进行快速分簇,保证对区域的全覆盖;网络运行期间结合能量和距离考虑负载均衡,分阶段采用不同的簇头选举和通信机制。仿真实验结果表明,与LEACH协议相比,HOBDE-LEACH的第一个节点死亡的轮循次数延长了66%,50%节点死亡时的网络轮循次数延长了20%;与LEACH-EI协议相比,所提协议的第一节点死亡的轮循次数延长了50%,50%节点死亡的网络轮循次数延长了19%。改进后的协议能有效地均衡网络负载和簇头节点能量消耗,更合理地分布簇头节点,延长网络生命周期。

    数据驱动的置信规则库构建与推理方法
    余瑞银 杨隆浩 傅仰耿
    2014, 34(8):  2155-2160.  DOI: 10.11772/j.issn.1001-9081.2014.08.2155
    摘要 ( )   PDF (1042KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对Liu等(LIU J, MARTINEZ L, CALZADA A, et al. A novel belief rule base representation, generation and its inference methodology. Knowledge-Based Systems, 2013, 53: 129-141)提出的扩展置信规则库(BRB)推理精度不够高的问题,提出了一种改进的规则库构建与推理方法。在Liu等提出的规则库构建方法的基础上,给出了一种新的生成规则前件与计算规则权重的方法;同时为了避免大量不必要的规则被激活,引入80/20法则改进规则激活策略,并最终形成完整的置信规则库构建与推理方法。通过输油管道检漏的实例对所提方法的准确性和效率进行对比分析。实验结果表明,所提方法能够在保证低耗时的同时,将系统平均绝对误差(MAE)降低到0.17342,具有较高的效率和精度。

    基于变速粒子群优化的置信规则库参数训练方法
    苏群 杨隆浩 傅仰耿 吴英杰 巩晓婷
    2014, 34(8):  2161-2165.  DOI: 10.11772/j.issn.1001-9081.2014.08.2161
    摘要 ( )   PDF (912KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对置信规则库(BRB)中参数优化模型的求解问题,引入群智能算法中的粒子群优化(PSO)算法,提出一种新的参数训练方法。将参数优化模型求解问题转换为带约束条件的非线性优化问题,在迭代寻优时限制粒子在搜索空间中,对失去速度的粒子重新赋予速度,维持种群中粒子多样性,从而实现参数训练。在输油管道检漏问题仿真实验中,训练后系统的平均绝对误差(MAE)为0.166478。实验结果表明,所提方法有理想的收敛精度,可用于置信规则库参数训练。

    新的模糊聚类有效性指标
    郑宏亮 徐本强 赵晓慧 邹丽
    2014, 34(8):  2166-2169.  DOI: 10.11772/j.issn.1001-9081.2014.08.2166
    摘要 ( )   PDF (582KB) ( )  
    参考文献 | 相关文章 | 计量指标

    在经典的模糊C均值(FCM)算法中,聚类数需要预先给出,否则算法无法工作,这在一定程度上限制了FCM算法的应用范围。针对FCM算法中聚类数需要预先设定问题,提出了一种新的模糊聚类有效性指标。首先,通过运行FCM算法得到隶属度矩阵;然后,通过隶属度矩阵计算类内紧密性和类间重叠性;最后,利用类内的紧密性和类间的重叠性定义了一个新的聚类有效性指标。该指标克服了FCM算法中类数需要预先设定的缺点,利用该指标可以发现最符合数据自然分布的类的数目。通过对人工数据集和实际数据集的测试表明,对于模糊因子取1.8,2.0和2.2三个不同的常用值,均能发现最优聚类数。

    基于容差优势关系的排序方法及其应用
    陈万翠 吕跃进 翁世洲
    2014, 34(8):  2170-2174.  DOI: 10.11772/j.issn.1001-9081.2014.08.2170
    摘要 ( )   PDF (715KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对序信息系统下经典优势关系过于严格从而可能导致排序方法失效的问题,首先,提出了容差优势关系的概念并对其相关性质予以研究;然后,基于容差优势关系,给出优势度的定义,并提出基于容差优势关系的方案排序方法;最后,将该方法应用于智能电网的综合评价中。实验结果表明:相比经典优势关系,容差优势关系对数据具有更强的容错能力,排序结果具有较强的区分度。容差优势关系的提出,能有效避免经典优势关系因属性个数较多、属性值互有优劣时可能引起的失效问题。

    并行挖掘频繁项目集新算法——MREclat
    章志刚 吉根林 唐梦梦
    2014, 34(8):  2175-2178.  DOI: 10.11772/j.issn.1001-9081.2014.08.2175
    摘要 ( )   PDF (605KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。

    基于链接重要性和数据场的链接预测算法
    陈巧玉 班志杰
    2014, 34(8):  2179-2183.  DOI: 10.11772/j.issn.1001-9081.2014.08.2179
    摘要 ( )   PDF (766KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对现有基于节点相似性的链接预测方法忽略了网络拓扑本身链接强度的信息,带权的拓扑路径方法中权值较难确定等缺陷,提出一种基于链接重要性和数据场的链接预测算法。首先,将所有链接边赋予不同的链接权重;其次,考虑潜在链接节点间的相互影响,对部分没有链接的节点进行链接预估计;最后,利用数据场势函数计算两节点间的相似值。在典型的网络数据进行的实验结果表明,所提方法在分类指标和推荐指标中都有很好的表现:以AUC为评价指标时,比同复杂度的局部路径(LP)算法提高了3到6个百分点;以DCG为评价指标时比LP算法提高了1.5到2.5个DCG值。算法整体上提高了预测准确性,且由于参数确定简单,复杂度又不高,在实际中易于部署。

    基于集成学习的无监督离散化算法
    徐盈盈 钟才明
    2014, 34(8):  2184-2187.  DOI: 10.11772/j.issn.1001-9081.2014.08.2184
    摘要 ( )   PDF (752KB) ( )  
    参考文献 | 相关文章 | 计量指标

    模式识别与机器学习的一些算法只能处理离散属性值,而在现实生活中的很多数据具有连续的属性值,针对数据离散化的问题提出了一种无监督的方法。首先,使用K-means方法将数据集进行划分得到类别信息;然后,应用有监督的离散化方法对划分后的数据离散化,重复上述过程以得到多个离散化的结果,再将这些结果进行集成;最后,将集成得到的最小子区间进行合并,这里根据数据间的邻居关系选择优先合并的维度及相邻区间。其中,通过数据间的近邻关系自动寻求子区间数目,尽可能保持其内在结构关系不变。将离散后的数据应用于聚类算法,如谱聚类算法,并对聚类后的效果进行评价。实验结果表明,该算法聚类精确度比其他4种方法平均提高约33%,表明了该算法的可行性和有效性。通过该算法得到的离散化数据可应用于一些数据挖掘算法,如ID3决策树算法。

    中文微博语料情感类别自动标注方法
    阳爱民 周咏梅 周剑峰
    2014, 34(8):  2188-2191.  DOI: 10.11772/j.issn.1001-9081.2014.08.2188
    摘要 ( )   PDF (611KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对大规模微博语料手动标注困难的问题,提出了中文微博语料情感类别自动标注的方法,包括基于关键词的、基于概率求和的和基于概率乘积的3种自动标注方法和一种集成标注方法。自动标注时首先分别使用3种标注方法进行标注,得到3种标注结果;然后,采用标注方法集成的策略,对3种标注的结果通过投票的方式决定最终的标注结果。通过设计自动标注实验系统进行实验,实验结果验证了所提方法的可行性和有效性。实验结果表明,单个标注方法的准确率均在70%以上,投票方法的准确率达90%以上。

    电影本体的构建与一致性分析
    高小龙 朱信忠 赵建民 曹存根 徐慧英 吴德
    2014, 34(8):  2192-2196.  DOI: 10.11772/j.issn.1001-9081.2014.08.2192
    摘要 ( )   PDF (881KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对移动网络对电影服务系统提出的更高要求和电影领域知识描述的不足,阐述构建电影领域本体(MO)的必要性和可行性:首先,概述电影本体的对象和组成,提出构建电影领域本体模型的原则和方法,利用OWL和Protege 4.1构建模型;其次,详细说明电影本体的类、属性、实例、公理和推理规则的具体表述;最后,分析电影本体的一致性,包括类间关系的一致性分析和基于公理的一致性分析。

    基于规则的汉语兼类词标注方法
    李华栋 贾真 尹红风 杨燕
    2014, 34(8):  2197-2201.  DOI: 10.11772/j.issn.1001-9081.2014.08.2197
    摘要 ( )   PDF (746KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对目前汉语兼类词标注的准确率不高的问题,提出了规则与统计模型相结合的兼类词标注方法。首先,利用隐马尔可夫、最大熵和条件随机场3种统计模型进行兼类词标注;然后,将改进的互信息算法应用到词性(POS)标注规则的获取上,通过计算目标词前后词单元与目标词的相关性获得词性标注规则;最后,将获取的规则与基于统计模型的词性标注算法结合起来进行兼类词标注。实验结果表明加入规则算法之后,平均词性标注准确率提升了5%左右。

    基于Agent社会圈子网络的语言竞争模型
    王超 毕贵红 张寿明 韦春桃
    2014, 34(8):  2202-2208.  DOI: 10.11772/j.issn.1001-9081.2014.08.2202
    摘要 ( )   PDF (1102KB) ( )  
    参考文献 | 相关文章 | 计量指标

    语言传播网络是一种典型的社会网络,语言网络的结构和动态性对语言的竞争与传播具有重要影响。鉴于此特点,提出以同一地区的语言竞争现象作为研究对象,利用基于Agent的社会圈子网络来构建更能接近实际的语言网络。社会网络中个体网络的结构参数和整体网络的参数都具有良好的社会网络特点。网络中的Agent可以被赋予不同大小的社会圈子,Agent可以在网络中移动、新生和死亡,进而引起社会网络旧关系的断开和新关系的建立。网络中的Agent的语言类型代表了单语X、单语Y和双语Z(单语X和单语Y)三类,语言的传播模型为横向传播和纵向传播。在分析了语言地位、吸引因子、横纵向传播的最高比例、语言的人口比例对语言竞争影响的基础上,重点分析了社会交往半径和社会流动性对语言竞争的影响。仿真结果表明,与静态社会网络模型相比,所提模型更加贴近实际社会,能够有效提高语言之间共存的可能性,为研究濒危语言的保存提供一个较好的环境。

    基于粗糙集的微博用户性别识别
    黄发良 熊金波 黄添强 刘西蒙
    2014, 34(8):  2209-2211.  DOI: 10.11772/j.issn.1001-9081.2014.08.2209
    摘要 ( )   PDF (487KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对微博消息往往会不同程度表现出性别倾向性的特点,从消息内容挖掘的角度出发提出了一种基于粗糙集的微博用户性别识别算法。设计了一种基于容差粗集的微博消息表示模型(TRSRM),有效地刻画微博消息的性别特征。实验结果表明,在1000个真实微博用户的微博消息的测试集下,所提模型的准确率比特征项频数表示模型平均提高了7%,取得了更好的识别效果。

    基于特征向量的最小二乘支持向量机PM2.5浓度预测模型
    李龙 马磊 贺建峰 邵党国 易三莉 相艳 刘立芳
    2014, 34(8):  2212-2216.  DOI: 10.11772/j.issn.1001-9081.2014.08.2212
    摘要 ( )   PDF (781KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对大气中细颗粒物(PM2.5)浓度预测的问题,提出一种预测模型。首先,通过引入综合气象指数综合考虑风力、湿度、温度等因素;然后,结合实际二氧化硫(SO2)浓度、二氧化氮(NO2)浓度、一氧化碳(CO)浓度和PM10浓度等,构成特征向量;最后,利用特征向量和PM2.5浓度数据来建立最小二乘支持向量机(LS-SVM)预测模型。经2013年城市A和城市B环境监测中心的数据预测分析表明,引入综合气象指数后预测的准确性提高,误差降低近30%。说明该模型能够较为准确地预测PM2.5浓度,并具有较高的泛化能力。此外还分析了PM2.5浓度与住院率、医院门诊量的关系,发现了它们的高度相关性。

    基于滑动窗口预测的水文时间序列异常检测
    余宇峰 朱跃龙 万定生 关兴中
    2014, 34(8):  2217-2220.  DOI: 10.11772/j.issn.1001-9081.2014.08.2217
    摘要 ( )   PDF (791KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对水文时间序列分析与决策中存在的数据质量问题,提出了基于滑动窗口预测的水文时间序列异常检测算法。首先基于滑动窗口对时间序列进行子序列分割,再以子序列为基础建立预测模型对未来值进行预测,并将预测值和实测值间差异范围大于预设阈值的序列点判定为异常。探讨了算法中的滑动窗口和参数设置,并以实例数据对算法进行了验证。实验结果表明,所提算法不仅能够有效挖掘出水文时间序列中的异常点,而且将异常检测的灵敏度和特异度分别提高到80%和98%以上。

    灰度累积投影直方图在胎冠缺陷检测中的应用
    韩延彬 王杰 夏英杰 李金屏
    2014, 34(8):  2221-2226.  DOI: 10.11772/j.issn.1001-9081.2014.08.2221
    摘要 ( )   PDF (950KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对轮胎胎冠帘线搭接缺陷的自动检测问题,提出一种基于胎冠X射线图像的检测方法。首先,依据胎冠的X射线影像和投影角计算胎冠成像的灰度累积投影曲线;然后,计算曲线的局部峰值能量分布;其次,采用前n个最大峰值能量构造投影曲线的能量特征向量,并利用支持向量机(SVM)分类器进行最大投影曲线的判别;最后,利用位置反演计算对缺陷进行定位。仿真实验结果表明,所提方法可以对生产过程中采集的1000幅胎冠图像进行有效的缺陷检测,其最高检测正确率可达97.7%。

    基于核非负稀疏表示的人脸识别
    薄纯娟 张汝波 刘冠群 汪雨哲
    2014, 34(8):  2227-2230.  DOI: 10.11772/j.issn.1001-9081.2014.08.2227
    摘要 ( )   PDF (615KB) ( )  
    参考文献 | 相关文章 | 计量指标

    提出了一种新颖的核非负稀疏表示(KNSR)算法,将其用于人脸识别,主要贡献有如下3个方面:首先,在稀疏表示(SR)的基础上引入了对表示系数的非负限制,并利用核函数来描述样本之间的非线性关系,提出了相应的目标函数;其次,提出了一种乘性梯度下降迭代算法对提出的目标函数进行优化求解,该算法在理论上可以保证收敛到全局最优值;最后,利用局部二元特征和汉明核来建模人脸样本的非线性关系,从而实现鲁棒的人脸识别。实验结果表明,在具有挑战性的人脸库上所提算法识别率均高于最近邻(NN)算法、支持向量机(SVM)、最近子空间(NS)、SR和协同表示(CR)算法,在YaleB和AR数据库上都达到了大约99%的识别率。

    基于联合双边滤波器的Kinect深度图像滤波算法
    李知菲 陈源
    2014, 34(8):  2231-2234.  DOI: 10.11772/j.issn.1001-9081.2014.08.2231
    摘要 ( )   PDF (846KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对Kinect镜头采集的深度图像一般有噪声和黑洞现象,直接应用于人体动作跟踪和识别等系统中效果差的问题,提出一种基于联合双边滤波器的深度图像滤波算法。算法利用联合双边滤波原理,将Kinect镜头同一时刻采集的深度图像和彩色图像作为输入,首先,用高斯核函数计算出深度图像的空间距离权值和RGB彩色图像的灰度权值;然后,将这两个权值相乘得到联合滤波权值,并利用快速高斯变换替换高斯核函数,设计出联合双边滤波器;最后,用此滤波器的滤波结果与噪声图像进行卷积运算实现Kinect深度图像滤波。实验结果表明,所提算法应用在人体动作识别和跟踪系统后,可显著提高在背景复杂场景中的抗噪能力,识别正确率提高17.3%,同时所提算法的平均耗时为371ms,远低于同类算法。所提算法保持了联合双边滤波平滑保边的优点,由于引入彩色图像作为引导图像,去噪的同时也能对黑洞进行修补,因此该算法在Kinect深度图像上的去噪和修复效果优于经典的双边滤波算法和联合双边滤波算法,且实时性强。

    网络与通信
    基于证据推理融合的网络数据流识别方法
    张剑 曹萍 寿国础
    2014, 34(8):  2235-2238.  DOI: 10.11772/j.issn.1001-9081.2014.08.2235
    摘要 ( )   PDF (620KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对多分类器决策融合研究中利用有限的训练数据对分类器概率参数估计时存在较大偏差的问题,提出一种基于D-S证据推理(ER)的多分类器决策融合算法。利用不确定性描述分类器性能,并针对D-S组合规则在分类器结果高冲突情形下易出现决策融合悖论的问题,提出基于分类器信度加权融合算法实现流量识别决策融合。实验结果表明,多数投票法和Bayes最大后验概率法识别准确率分别为78.3%和81.7%,证据推理决策融合的识别准确率提高到82.2%~91.6%,而拒识率则保持在4.1%~6.2%。

    认知Mesh网络中基于免疫多目标优化的频谱分配
    李亚伦 杨亚楠 柴争义
    2014, 34(8):  2239-2242.  DOI: 10.11772/j.issn.1001-9081.2014.08.2239
    摘要 ( )   PDF (588KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对认知无线Mesh网络(CWMN)的频谱分配问题,提出了一种基于免疫多目标优化的实现算法。该算法将要求解的频谱分配建模为最大化总带宽和最小化占用频谱数的多目标优化问题,设计了适合问题求解的抗体编码方式、整体克隆算子和非支配抗体选择算子。仿真实验结果表明,所提算法可以求得CWMN频谱分配问题的Pareto最优解,提高了最大化总带宽,减少了最小化占用频谱,优化了频谱分配性能。

    GPU OpenFlow海量数据网络处理模型——GOMDI
    张伟 解争龙 丁要军 张潇晓
    2014, 34(8):  2243-2247.  DOI: 10.11772/j.issn.1001-9081.2014.08.2243
    摘要 ( )   PDF (840KB) ( )  
    参考文献 | 相关文章 | 计量指标

    OpenFlow的出现提高了现有网络的服务质量(QoS),但在处理海量数据时存在网络会话识别效率低、网络报文转发路径不佳等缺点。在OpenFlow的研究基础上,提出了海量网络数据处理(GOMDI)模型,通过将GPU并行计算、生物序列算法和机器学习方法相融合,设计出GOMDI网络会话匹配算法和路径选择算法。实验结果表明,GOMDI网络会话匹配算法与CPU环境相比加速比提升了近300;路径选择算法中网络丢包率低于5%,网络延时小于20ms。因此,GOMDI模型可有效地提升网络性能,满足大数据环境下实时处理海量信息的需求。

    基于改进强跟踪无迹卡尔曼滤波的正交频分复用频偏跟踪和估计算法
    杨朝阳 杨霄鹏 李腾 姚昆 张衡阳
    2014, 34(8):  2248-2251.  DOI: 10.11772/j.issn.1001-9081.2014.08.2248
    摘要 ( )   PDF (697KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对高速运动环境下多普勒效应导致的载波频偏,建立了正交频分复用(OFDM)动态状态空间模型,提出了基于改进的强跟踪无迹卡尔曼滤波(STUKF)的频偏跟踪和估计算法。该算法将强跟踪滤波思想跟UKF相结合,通过在计算量测预测协方差和互协方差时引入渐消因子,在调整前一时刻频偏估计误差协方差的同时又控制过程噪声协方差,实时调整增益矩阵,增强了对时变频偏的跟踪能力,提高了估计精度。最后分别在非时变和时变频偏模型下对所提算法进行了仿真验证。仿真结果表明,与UKF频偏估计算法相比,所提算法在时变频偏中具有更好的跟踪和估计性能,在相同误码率(BER)下信噪比(SNR)大约有1dB的提升。

    先进计算
    基于灰色关联度的云计算虚拟机分配方法
    何丽
    2014, 34(8):  2252-2255.  DOI: 10.11772/j.issn.1001-9081.2014.08.2252
    摘要 ( )   PDF (626KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对云计算系统中资源利用率提高和系统能耗降低之间的协调问题,提出了一种新的基于灰色关联度的虚拟机分配方法,应用灰色关联度的基本理论建立了基于服务层协议(SLA)违背率、系统能耗和服务器负载评价函数的虚拟机分配决策模型,构造了基于灰色关联度的虚拟机分配算法,并在CloudSim仿真平台上进行了实验。实验结果表明,与传统的基于简单线性权重的多目标优化方法相比,在不同的虚拟机选择策略下,基于灰色关联度的虚拟机分配方法在系统能耗、SLA违背率和虚拟机迁移次数上平均降低〖BP(〗是提高吗?应该是降低吧?请明确一下。〖BP)〗了6.8%、5.2%和15.5%。因此,所提方法在不同的虚拟机选择策略下能够大幅度减少虚拟机迁移次数,较好地满足系统在能耗和SLA违背率上的优化需求。

    基于用户访问特征的云存储副本动态管理节能策略
    王政英 于炯 英昌甜 鲁亮 班爱琴
    2014, 34(8):  2256-2259.  DOI: 10.11772/j.issn.1001-9081.2014.08.2256
    摘要 ( )   PDF (793KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对云计算环境下服务器利用率低、能耗浪费严重的问题,提出一种基于用户访问特征的云存储副本动态管理节能策略。通过把用户访问特征的研究转化为计算Block的访问热度,根据节点的整体访问热度,DataNode主动申请休眠从而达到节能的目的。给出了详细的休眠申请、休眠判断算法,以及在DataNode休眠期间出现对已休眠Block进行访问的情况时如何处理的解决方案。实验结果表明,采用该策略后可休眠29%~42%的DataNode,减少能耗31%,且服务器的用户响应时间不受影响。经过性能分析,得出该策略在保证数据可用性的同时可有效地降低能耗。

    数据依赖约束下的任务调度资源选择算法
    廖彬 于炯 张陶 杨兴耀
    2014, 34(8):  2260-2266.  DOI: 10.11772/j.issn.1001-9081.2014.08.2260
    摘要 ( )   PDF (1100KB) ( )  
    参考文献 | 相关文章 | 计量指标

    大数据环境下的计算任务往往具有一定数据依赖性关系(如MapReduce),现有的分布式存储系统任务资源选择策略选择离请求者最近的数据块响应服务,忽略了对数据块所在服务器CPU、磁盘I/O与网络等资源负载状态的考虑。在分析研究系统集群结构、文件分块、数据块存储机制的基础上,定义了集群节点矩阵、CPU负载矩阵、磁盘I/O负载矩阵、网络负载矩阵、文件分块矩阵、数据块存储矩阵与数据块存储节点状态矩阵,为任务与数据之间的依赖性构建了基础数据模型,提出了一种数据依赖约束下的最优资源选择算法(ORS2DC)。任务调度节点负责维护基础数据,MapReduce任务与数据块读取任务由于依赖资源不同而采取不同的选择策略。实验结果表明:所提算法能够为任务选择质量更高的资源,提高任务完成质量的同时减轻了NameNode负担,减小了单点故障发生的概率。

    基于数据分类存储的云存储系统节能算法
    张陶 廖彬 孙华 李丰军 姬金虎
    2014, 34(8):  2267-2272.  DOI: 10.11772/j.issn.1001-9081.2014.08.2267
    摘要 ( )   PDF (956KB) ( )  
    参考文献 | 相关文章 | 计量指标

    云存储规模的不断扩大以及设计时对能耗因素的忽略使其日益暴露出高能耗低效率的问题,并且此问题已经成为制约云计算与大数据快速发展的一个主要瓶颈。已有研究大多采用将整个存储节点调整到低能耗模式以达到节能的目的。根据数据的重复性及访问规律,设计了基于数据分类的存储模型,将存储区域划分为热数据块区、冷数据块区与重复文件区,根据不同数据的重复性及活动因子特点进行分区存储。围绕新的存储模型,设计了适应节能的数据存储算法并建立了能耗模型。实验结果表明:当系统负载小于设定阈值时,新的存储模型能够提高存储系统25%左右的能耗利用率。

    人工智能
    案例推理分类器属性权重的内省学习调整方法
    张春晓 严爱军 王普
    2014, 34(8):  2273-2278.  DOI: 10.11772/j.issn.1001-9081.2014.08.2273
    摘要 ( )   PDF (909KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对案例推理(CBR)分类器中案例属性权重的分配问题,提出一种基于内省学习的属性权重迭代调整方法。该方法可根据CBR分类器对训练案例分类的结果调整属性的权重。基于成功驱动的权重学习策略,若当前训练案例分类成功,则首先根据权重调整公式增加匹配属性的权重并减少不匹配属性的权重;然后对所有权重进行归一化从而得到当次迭代的新权重。实验结果表明,所提方法的CBR分类器在UCI数据集PD、Heart和WDBC的准确率比传统CBR分类器分别提高1.72%、4.44%和1.05%。故成功驱动的内省学习权重调整方法可以提高权重分配的合理性,进而提高CBR分类器的准确率。

    优化子空间的高维聚类算法
    吴涛 陈黎飞 郭躬德
    2014, 34(8):  2279-2284.  DOI: 10.11772/j.issn.1001-9081.2014.08.2279
    摘要 ( )   PDF (968KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对当前大多数典型软子空间聚类算法未能考虑簇类投影子空间的优化问题,提出一种新的软子空间聚类算法。该算法将最大化权重之间的差异性作为子空间优化的目标,并提出了一个量化公式。以此为基础设计了一个新的优化目标函数,在最小化簇内紧凑度的同时,优化每个簇所在的软子空间。通过数学推导得到了新的特征权重计算方法,并基于k-means算法框架定义了新聚类算法。实验结果表明,所提算法对子空间的优化降低了算法过早陷入局部最优的可能性,提高了算法的稳定性,并且具有良好的性能和聚类效果,适合用于高维数据聚类分析。

    多模型数据集的免疫鲁棒回归分析
    徐雪松 舒俭
    2014, 34(8):  2285-2290.  DOI: 10.11772/j.issn.1001-9081.2014.08.2285
    摘要 ( )   PDF (948KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对传统多模型数据集回归分析方法计算时间长、模型识别准确率低的问题,提出了一种新的启发式鲁棒回归分析方法。该方法模拟免疫系统聚类学习的原理,采用B细胞网络作为数据集的分类和存储工具,通过判断数据对模型的符合度进行分类,提高了数据分类的准确性,将模型集抽取过程分解成“聚类”“回归”“再聚类”的反复尝试过程,利用并行启发式搜索逼近模型集的解。仿真结果表明,所提方法回归分析时间明显少于传统算法,模型识别准确率明显高于传统算法。根据8模型数据集分析结果,传统算法中,效果最好的是基于RANSAC的逐次提取算法,其平均模型识别准确率为90.37%,需53.3947s;计算时间小于0.5s的传统算法,其准确率不足1%;所提算法仅需0.5094s,其准确率达到了98.25%。

    结合欠抽样与集成的软件缺陷预测
    李勇
    2014, 34(8):  2291-2294.  DOI: 10.11772/j.issn.1001-9081.2014.08.2291
    摘要 ( )   PDF (745KB) ( )  
    参考文献 | 相关文章 | 计量指标

    软件缺陷预测是提高测试效率、保证软件可靠性的重要途径。为了提高软件缺陷预测的准确率,提出一种结合欠抽样与决策树分类器集成的软件缺陷预测模型。考虑到软件缺陷数据的类不平衡特性,首先,通过数据的不平衡率确定抽样度,执行欠抽样实现数据的重新平衡;然后,采用Bagging随机抽样原理训练若干个决策树子分类器;最后,按照少数服从多数的原则生成预测模型。使用公开的NASA软件缺陷预测数据集进行了仿真实验。实验结果表明,与3种基准方法对比,所提模型在保证预报率的前提下,误报率(PF)降低了10%以上,综合评价指标均有显著提升。该模型的缺陷预测误报率较低,而且具有较高的预测准确率与稳定性。

    结合元胞自动机的果蝇优化算法
    贺智明 宋建国 梅宏标
    2014, 34(8):  2295-2298.  DOI: 10.11772/j.issn.1001-9081.2014.08.2295
    摘要 ( )   PDF (743KB) ( )  
    参考文献 | 相关文章 | 计量指标

    果蝇优化算法(FOA)作为一类新的优化搜索算法,广泛应用于各种优化问题。针对该算法后期求解精度低、容易陷入局部最优且收敛缓慢的缺点,提出一种结合元胞自动机的果蝇优化算法(CAFOA)。该算法在首次求解时利用元胞演化规则选择果蝇最优个体邻域,然后对选择后的果蝇个体位置进行随机扰动,分别用邻域个体复制更新演化前个体位置,再次进行迭代寻优,从而有效克服算法陷入局部最优。对6种常见测试函数进行了运算仿真。实验结果表明,所提算法比传统算法的平均收敛精度提高10%,达到稳定全局最优值的平均迭代次数减少870次,从而论证了算法的有效性。

    基于精英蜂群搜索策略的人工蜂群算法
    马卫 孙正兴
    2014, 34(8):  2299-2305.  DOI: 10.11772/j.issn.1001-9081.2014.08.2299
    摘要 ( )   PDF (1013KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对人工蜂群(ABC)算法存在收敛速度慢、求解精度不高、容易陷入局部最优等问题,利用蜂群觅食过程中先由侦察蜂进行四处侦察食物,并利用蜂群搜索构建精英群体指导蜂群觅食寻优。据此,提出了一种模拟侦察蜂侦察觅食行为的基于精英蜂群搜索策略的连续优化算法。算法利用构建精英蜂群策略、改进侦察蜂搜索机制以及基于目标函数值选择寻优三个主要策略加强算法的搜索机制。数值实验表明,所提算法不仅寻优精度和寻优率非常高,且收敛速度快,并能适于高维空间的优化问题。

    多粒子角色协同作用的混合粒子群优化算法
    吴逸庭 戴月明 纪志成 吴定会
    2014, 34(8):  2306-2310.  DOI: 10.11772/j.issn.1001-9081.2014.08.2306
    摘要 ( )   PDF (757KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对粒子群优化(PSO)算法易陷入局部最优和后期收敛速度慢的问题,提出一种多粒子角色协同作用的混合粒子群算法(MPRPSO)。引入粒子角色的概念,将种群粒子分成探索粒子(EP)、巡逻粒子(PP)和局部开发粒子(LEP)三类角色,在每次迭代中利用探索粒子以标准PSO算法搜索解空间,用基于混沌的巡逻粒子加强全局搜索,并在陷入局部最优时替代部分探索粒子,恢复种群活力。最后通过局部开发粒子的单维异步邻域搜索加强算法局部搜索能力,加快收敛。实验独立运行30次,所提算法在粒子角色比例为0.8∶〖KG-*2〗0.1∶〖KG-*2〗0.1的条件下,在Sphere、Rosenbrock、Ackley和Quadric函数中获得的平均值分别为2.352E-72、4.678E-29、7.780E-14和2.909E-14,尤其在Rastrigrin与Griewank函数中能收敛到最优解0,优于其他对比算法。实验结果表明,所提算法在优化性能上有所提高,并有一定的鲁棒性。

    基于模拟退火的在线Web文档内容数据质量评估
    韩京宇 陈可佳
    2014, 34(8):  2311-2316.  DOI: 10.11772/j.issn.1001-9081.2014.08.2311
    摘要 ( )   PDF (1008KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对基于训练模型或用户交互的Web数据质量评估方法不能在线响应,也不能获取内容事实内涵的问题,提出一种基于模拟退火(SA)的在线Web文档内容数据质量评估(QASA)方法。首先,通过在Web上搜集主题相关文档,构建目标文档的相关空间,进一步采用开放式信息抽取技术抽取文档内容的事实;然后,采用SA技术在线构建两个最重要的数据质量维度即准确性和完整性的参照;最后,通过比对目标文档和维度参照的事实来量化数据质量维度。实验结果表明,QASA方法可以及时返回近似最优解,并保持与离线算法等同或高于10%的精度。该方法不仅能满足实时响应的要求,而且具有高的评估精度,可应用于在线识别高质量的Web文档。

    基于文本分类的商品评价情感分析
    钟将 杨思源 孙启干
    2014, 34(8):  2317-2321.  DOI: 10.11772/j.issn.1001-9081.2014.08.2317
    摘要 ( )   PDF (754KB) ( )  
    参考文献 | 相关文章 | 计量指标

    为了在准确判断商品评价情感倾向的同时提高识别效率,提出了基于矩阵投影(MP)和归一化向量(NLV)的文本分类算法实现对商品评价的情感分析。首先,利用矩阵投影提取商品评价的特征词;然后,计算每一类别中特征词的平均特征频率(FF),采用归一化函数(NLF)对平均特征频率进行归一化处理,得到每一类别的归一化向量;最后,通过比较评价的特征向量与每一类别的归一化向量的相似度预测评价的情感倾向。与k近邻(kNN)、朴素贝叶斯(NB)和支持向量机(SVM)算法进行了对比,实验结果表明该算法具有较高的预测准确度和分类速度:尤其与kNN算法相比该算法有明显优势,该算法的宏平均F1值比kNN高出12%以上,分类时间缩短了11/12;与SVM算法相比分类速度也大幅提高。

    基于商品特征关联度的购物客户评论可信排序方法
    黄婷婷 曾国荪 熊焕亮
    2014, 34(8):  2322-2327.  DOI: 10.11772/j.issn.1001-9081.2014.08.2322
    摘要 ( )   PDF (1163KB) ( )  
    参考文献 | 相关文章 | 计量指标

    电子商务网站中,海量无序的用户评论可能导致消费者客户“迷失”其中,无法识别评论的可信和真假。针对这个问题,提出了一种根据用户评论的可信度对其重新排序的方法。首先,针对网站商品广告信息,关注在线用户评论内容是否和商品功能属性密切相关,设计了基于HTML脚本格式的购物网站中商品关键特征提取算法,给出了基于自然语言处理的用户评论特征词提取方法;然后,利用词语相似度来分析商品特征和用户评论内容之间的关联度,提出了购物客户评论的可信度计算方法;最后,通过实例分析,实现了大量购物客户评论的可信排序,使得用户无须浏览全部或者大部分之后就能判断哪些评价可以信任或者具有实际的参考价值,降低了信息搜索成本,提高了决策效率。

    集成社会化标签和用户背景信息的协同过滤推荐方法
    蒋胜 王忠群 修宇 皇苏斌
    2014, 34(8):  2328-2331.  DOI: 10.11772/j.issn.1001-9081.2014.08.2328
    摘要 ( )   PDF (617KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对传统的协同推荐算法存在数据稀疏和推荐精度低的问题,提出了一种集成社会化标签和用户背景信息的协同过滤(CF)推荐方法。首先,分别计算基于社会化标签和用户背景信息的用户间的相似度;然后,基于用户评分计算用户间的相似度;最后,集成上述3种相似性度量产生用户间综合相似度,并对目标用户进行项目推荐。实验结果表明,与传统的协同过滤推荐算法相比,所提方法在正常数据集和冷启动数据集下的平均绝对误差(MAE)平均降低了16%和22.6%。该方法不仅能有效地提高推荐算法的精度,而且能较好地解决数据稀疏和冷启动的问题。

    基于主题树的微博突发话题检测
    邱云飞 郭弥纶 邵良杉
    2014, 34(8):  2332-2335.  DOI: 10.11772/j.issn.1001-9081.2014.08.2332
    摘要 ( )   PDF (623KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对传统话题检测方法不能很好处理微博中用语不规范、随意性强、指代不明确以及存在大量网络用语的问题,提出了一种基于潜在狄利克雷分配(LDA)模型的主题树检测方法。首先,运用自然语言处理(NLP)中增大信息熵的方法将相关微博整理成一棵主题树,配合狄利克雷先验α与经验值β随主题数目动态变化的设计思想,结合该模型独特的双重概率统计模式,实现了对文本中每个词“贡献度”的统计,提前处理掉干扰信息,排除垃圾数据对话题检测的影响;然后,利用该“贡献度”作为空间向量模型(VSM)改进后的参数值计算文档间相似度来提取突发话题,达到提高突发话题检测精准度的目的。提出的基于LDA模型的主题树检测方法从F值比对与人工检测两个角度进行了相关实验,实验数据显示该算法不仅可以检测到突发话题,而且获得的结果与知网模型和TF-IDF算法相比分别高出3%、7%,且更符合人的判断逻辑。

    计算机安全
    轻量级的数据融合隐私保护算法
    陈燕俐 傅春福 许建 杨庚
    2014, 34(8):  2336-2341.  DOI: 10.11772/j.issn.1001-9081.2014.08.2336
    摘要 ( )   PDF (986KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对隐私数据易受数据机密性、完整性和新鲜性攻击这一问题,提出了一种基于同态Hash函数的无线传感器网络(WSN)数据融合隐私保护算法——HPDA算法。利用同态加密算法保证了融合数据的机密性,通过构建同态Hash函数进行数据的完整性和新鲜性检测,通过改进的ID传输机制减少系统的通信开销。理论分析和实验仿真结果表明,HPDA算法在无线传感器网络数据融合过程中具有良好的数据机密性、完整性和新鲜性保护,且具有较低的通信开销。

    无证书签名方案的安全性分析与改进
    樊爱宛 申远 赵伟艇
    2014, 34(8):  2342-2344.  DOI: 10.11772/j.issn.1001-9081.2014.08.2342
    摘要 ( )   PDF (627KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对王怡等(王怡,杜伟章.无双线性对的无证书签名方案的分析及改进.计算机应用,2013,33(8):2250-2252)提出的无双线性对运算的无证书签名方案,指出该方案无法抵抗伪造性攻击,并提出改进方案。改进方案加强了签名算法中参数的关联程度,以抵抗伪造性攻击。安全性分析结果表明,在随机预言机模型下,新方案对于自适应选择消息和身份攻击是存在性不可伪造的。改进方案避开双线性对和逆运算,效率优于已有方案。

    基于组织的四层访问控制模型跨域访问过程中虚拟岗位构建方法
    彭友 宋艳 鞠航 王延章
    2014, 34(8):  2345-2349.  DOI: 10.11772/j.issn.1001-9081.2014.08.2345
    摘要 ( )   PDF (746KB) ( )  
    参考文献 | 相关文章 | 计量指标

    对于基于组织的四层访问控制(OB4LAC)模型在跨域访问控制过程中如何依据外域用户的申请权限集构建本域内虚拟岗位的问题,提出基于如下三阶段的处理流程,包括申请权限集与角色集的匹配搜索阶段、角色集职责分离(SoD)约束和激活约束判断阶段以及虚拟岗位的生成和撤销阶段。针对申请权限集与角色集的匹配搜索阶段,分别给出了面向完全匹配、可用性优先匹配和最小特权优先匹配的搜索算法;针对角色集SoD约束和激活约束判断阶段,则通过定义SoD约束矩阵(SODM)、非连通继承关系矩阵(AIM)和基数约束矩阵(CCM)以及对应的约束判断流程予以解决;针对虚拟岗位的生成和撤销阶段,给出了完成这一过程所需的管理函数。通过上述具体处理流程和实现算法,很好地解决了OB4LAC模型跨域访问过程中虚拟岗位的构建问题。

    网络编码数据传输的联合保障机制
    朱馨培 寇应展 王湛昱
    2014, 34(8):  2350-2355.  DOI: 10.11772/j.issn.1001-9081.2014.08.2350
    摘要 ( )   PDF (924KB) ( )  
    参考文献 | 相关文章 | 计量指标

    为了提高基于网络编码的数据传输的完整性、机密性和隐私性,提出了一种使用数字水印、栈混洗和信息认证码(MAC)等技术的安全保障机制。该机制通过异或(XOR)加密和栈混洗技术来混淆信息,提供机密性和隐私保证;通过数字水印将信息认证码随机插入混淆后的信息,进而提高机密性;中间转发节点通过验证部分信息认证码来提供完整性保证。仿真结果表明,该机制能有效降低污染信息传播跳数(低于1.5跳),即使拥有25个共谋攻击者和密钥池大小为100时,共谋概率也仅为0.1。理论分析和仿真实验证明,所提机制使得基于网络编码的数据传输能以较低的性能开销抵抗偷听攻击、流量分析攻击和污染攻击。

    基于位置服务中防止敏感同质性攻击的个性化隐私保护
    吴雷 潘晓 朴春慧 李占平
    2014, 34(8):  2356-2360.  DOI: 10.11772/j.issn.1001-9081.2014.08.2356
    摘要 ( )   PDF (772KB) ( )  
    参考文献 | 相关文章 | 计量指标

    基于位置服务中的隐私保护方法存在只关注保护用户位置和标识信息的问题,当匿名集中提出的查询均属于敏感查询时,将产生敏感同质性攻击。针对此问题,提出了个性化(k,p)-敏感匿名模型。并基于此模型,提出了基于树型索引结构的匿名算法——PTreeCA。空间数据库中的树型索引具有两大特点:1)空间中的用户已根据位置邻近性在树中被大致分组;2)在树的中间节点中可以存储聚集信息。利用这两个特点,PTreeCA可以从查询用户所在叶子节点和其兄弟节点中寻找匿名集,提高了匿名算法的效率。最后,在模拟和真实数据集上进行了实验,所提算法平均匿名成功率可达100%,平均匿名时间只有4ms。当隐私级别较低和适中时,PTreeCA在匿名成功率、匿名时间和匿名代价方面均表现出良好性能。

    用于医学影像快速篡改检测和恢复的无损水印算法
    刘定军 陈志刚 邓小鸿
    2014, 34(8):  2361-2364.  DOI: 10.11772/j.issn.1001-9081.2014.08.2361
    摘要 ( )   PDF (801KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对现有方法中篡改检测效率不高、定位不精确的问题,提出了一种基于无损水印和四叉树分解的医学图像快速篡改检测及恢复的方法。利用对医学图像进行四叉树分解过程中的层次结构特点,提高了篡改检测精确性和定位速度;同时使用分解后块中对角线像素均值作为恢复特征值,保证篡改后图像的修复质量。实验结果表明,与现有方法相比,所提方法在尺寸为512×512的图像中,定位比较次数降至6.7次左右,篡改定位精确性提高了5%左右。

    虚拟现实与数字媒体
    地球观测1号高光谱与全色图像融合的最佳方法
    林志垒 晏路明
    2014, 34(8):  2365-2370.  DOI: 10.11772/j.issn.1001-9081.2014.08.2365
    摘要 ( )   PDF (1090KB) ( )  
    参考文献 | 相关文章 | 计量指标

    受制于成像原理及制造技术等因素,航天高光谱遥感图像的空间分辨率相对较低,为此提出将高光谱图像与高空间分辨率图像进行融合处理,设计最佳的增强高光谱遥感图像空间分辨率的融合算法。针对地球观测1号(EO-1)Hyperion高光谱图像和高级陆地成像仪(ALI)全色波段图像的特点,从9种具体遥感图像融合算法中选用4种融合算法开展山区与城市的数据融合实验,即Gram-Schmidt光谱锐化融合法、平滑调节滤波(SFIM)变换融合法、加权平均法(WAM)融合法和小波变换(WT)融合法,并分别从定性、定量和分类精度三方面对这些方法的融合效果进行综合评价与对比分析,从而确定适合EO-1高光谱与全色图像融合的最佳方法。实验结果显示:从图像融合效果看,在所采用的4种融合方法中,Gram-Schmidt光谱锐化融合法的效果最好;从图像分类效果看,基于融合图像的分类效果要优于基于源图像的分类效果。理论分析与实验结果均表明:Gram-Schmidt光谱锐化融合法是一种较为理想的高光谱与高空间分辨率遥感图像的融合算法,为提高高光谱遥感图像的清晰度、可靠性及图像的地物识别和分类的准确性提供有力的支持。

    基于Kinect的三维视觉里程计的设计
    王亚龙 张奇志 周亚丽
    2014, 34(8):  2371-2374.  DOI: 10.11772/j.issn.1001-9081.2014.08.2371
    摘要 ( )   PDF (787KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对移动服务机器人在未知环境下三维路径估计的问题,设计了一种基于Kinect的实时估计机器人运动轨迹的方法。该方法采用Kinect获取机器人运动过程中连续帧的彩色和深度信息,首先,提取并匹配目标帧和参考帧的SURF的特征点;然后,结合深度信息利用经典P3P问题的方法及改进的随机采样一致性(RANSAC)算法计算机器人的初始6自由度(DOF)位姿;最后,通过非线性最小二乘算法最小化初始位姿内点的双向投影误差来提高位姿精度,进而得到机器人的运动轨迹。同时对比了不同特征点及描述符结合下的里程计精度。实验结果表明,所提方法能够将里程计误差降低到3.1%,且能够满足实时要求,可为机器人同时定位与地图创建提供重要的先验信息。

    高效率视频编码帧内快速算法
    许东旭 林其伟
    2014, 34(8):  2375-2379.  DOI: 10.11772/j.issn.1001-9081.2014.08.2375
    摘要 ( )   PDF (740KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对高效率视频编码(HEVC)帧内预测过程中较高的计算复杂度,首先在编码单元(CU)决策的层面上,提出了一种基于绝对误差和(SATD)的CU分割提前终止方案:对于每个深度级的CU,判断该CU最小的SATD值是否小于给定的阈值;若是,则终止该CU的分割过程。同时,基于统计的分析,依照各候选模式成为最优预测模式的概率,进一步排除低概率的候选模式。实验结果表明,同原始HM10.1相比,所提算法可以节省编码时间30.5%,并且保持视频质量几乎不变(平均Y方向峰值信噪比仅降低0.02dB)。此外,所提算法软硬件实现简单,而且容易与其他算法进一步融合,进一步降低HEVC的帧内编码复杂度。

    多特征联合的稀疏跟踪方法
    胡昭华 徐玉伟 赵孝磊 何军
    2014, 34(8):  2380-2384.  DOI: 10.11772/j.issn.1001-9081.2014.08.2380
    摘要 ( )   PDF (927KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对目标跟踪中单一特征描述目标能力较弱的情况,提出一种多种特征联合的稀疏表示跟踪方法。在粒子滤波框架下,首先,提取目标模板和候选粒子的多种特征并对其进行核化处理;然后,用字典模板对各候选粒子进行联合稀疏表示,采用可核化的加速近端梯度(KAPG)方法求解稀疏系数并实现候选粒子的重构;最后,将具有最小重构误差的粒子作为跟踪结果。跟踪过程中,利用子空间学习的方法实现目标模板的更新。实验结果表明,与现有跟踪算法相比,该算法提高了跟踪精度,并在目标存在遮挡、光照变化、运动突变等情况时,均可以取得较好的跟踪效果。

    基于彩色结构光的自动编码算法
    王勇 饶勤菲 唐靖 袁巢燕
    2014, 34(8):  2385-2389.  DOI: 10.11772/j.issn.1001-9081.2014.08.2385
    摘要 ( )   PDF (779KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对光栅投影三维轮廓测量中被测对象所含特性越来越复杂,提取到的细化光栅条纹存在大量断裂,导致细化条纹编码困难的问题,提出了一种基于彩色结构光的自动编码算法。设计了一种新的彩色结构光模型并且给出了其设计原理,实现了一种新的条纹自动编码算法。该算法从投影的彩色结构光栅中提取到带有颜色信息的细化光栅条纹,通过判断条纹最佳相邻的连通区域依次对其每种颜色的细化条纹进行编码,最后利用光栅模型的周期性进行组合编码得到完整图像的条纹编码。仿真实验结果表明:该彩色结构光模型设计简单,条纹自动编码算法的准确率较高,其误差能够降低将近10%,利用得到的条纹编码数据能够重建出较理想的三维点云数据模型。

    802.11e中失真驱动的视频传输跨层优化
    吴为民 谈娟 段平
    2014, 34(8):  2390-2393.  DOI: 10.11772/j.issn.1001-9081.2014.08.2390
    摘要 ( )   PDF (643KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对H.264视频在802.11e无线网络中传输时,由丢包和编码量化引起的接收端失真问题,提出了一种以失真为驱动的跨层优化算法,以减少接收端的失真。通过率失真模型得到量化参数(QP)和量化失真之间的关系后,根据不同视频数据分区的丢包率,估计出接收端的传输失真和总体失真;然后,以这个总体失真为依据,提出一个求最优量化参数的选择算法。实验结果表明,所提方法相比只针对H.264视频不同数据分区赋予不同传输优先级的由上向下跨层架构,或者只考虑根据传输丢包率调整编码器量化参数的由下到上的跨层架构,平均峰值信噪比(PSNR)提高了1~2dB,具有更小的接收端失真。

    高斯加权的多分类器物体追踪
    兰远东 邓辉舫 蔡昭权 杨雄
    2014, 34(8):  2394-2398.  DOI: 10.11772/j.issn.1001-9081.2014.08.2394
    摘要 ( )   PDF (977KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对在物体外观快速变化的情况下,大多数弱学习器不能捕获物体新的特征分布,导致追踪失败的问题,提出了高斯加权的联机多分类器增强算法。该算法为每一个领域问题定义一个弱分类器,每个弱分类器包括一个简单的视觉特征和阈值,引入高斯加权函数来权衡每个弱分类器在特定样本上的贡献,通过多分类器联合学习来提高追踪性能。在物体追踪过程中,联机多分类器在对物体定位的同时还能估计物体的姿态,能够成功地学习多模态外观模型,在物体外观快速变化的情况下追踪物体。实验结果表明:所提算法在经过一个较短序列的训练后,平均追踪错误率为12.8%,追踪性能明显提升。

    基于均值漂移的半监督支持向量机图像分类
    王朔琛 汪西莉 马君亮
    2014, 34(8):  2399-2403.  DOI: 10.11772/j.issn.1001-9081.2014.08.2399
    摘要 ( )   PDF (845KB) ( )  
    参考文献 | 相关文章 | 计量指标

    标签均值半监督支持向量机(meanS3VM)在图像分类中随机选取少量无标记样本训练分类器的正确率较低,且其参数取值使结果波动性较大,针对这一问题,提出基于均值漂移(mean shift)的meanS3VM图像分类方法。以mean shift平滑图为分类对象,以降低图像特征多样性;在每个平滑区域随机选取一个样本作为无标记样本,以保证其携带对分类有用的信息而得到高效的分类器;探讨并改进参数取值方法,网格寻优敏感参数,参数ep结合支持向量机(SVM)预分类和mean shift结果估计,以获取更好更稳定的结果。实验结果表明,所提方法对普通和加噪图像的分类正确率比改进参数取值的原算法分别平均提高1和5个百分点以上,获得了更高的时间效率,且有效避免了分类结果的波动性,适用于图像分类。

    基于行为分析的微博信息传播效果
    齐超 陈鸿昶 于岩
    2014, 34(8):  2404-2408.  DOI: 10.11772/j.issn.1001-9081.2014.08.2404
    摘要 ( )   PDF (854KB) ( )  
    参考文献 | 相关文章 | 计量指标

    微博的传播效果研究对于提高市场营销效率、加强舆情监控和准确发现热点具有重要作用。针对以前传播效果研究中未考虑用户个体差异的问题,提出一种基于行为分析的微博转发规模和传播深度预测方法。从微博用户自身、用户关系和微博内容3个方面提取9个相关特征,结合逻辑回归(LR)方法提出一种转发行为预测模型,并基于此模型结合信息沿用户传播特点,通过逐级对相邻用户迭代统计分析得到转发规模和传播深度预测方法。在新浪微博数据集上的实验结果表明,所提方法对转发规模和传播深度预测的正确率分别约为87.1%和81.6%,能较好地预测出信息传播效果。

    行业与领域应用
    基于最小边界扇形的移动对象轨迹实时化简算法
    王欣然 杨智应
    2014, 34(8):  2409-2414.  DOI: 10.11772/j.issn.1001-9081.2014.08.2409
    摘要 ( )   PDF (981KB) ( )  
    参考文献 | 相关文章 | 计量指标

    为了对全球定位系统(GPS)设备采集到的移动对象原始轨迹数据进行简化,提高轨迹数据的使用效率,降低移动终端的通信代价和计算开销,提出了一种基于最小边界扇形(MBS)的移动对象轨迹实时化简算法。该算法不同于用一条折线来近似原始轨迹的方法,它利用扇形预测范围来估计、简化原始轨迹,在角度和距离两个层面上对简化误差进行控制。提出了新的误差度量方法——基于等极径的误差度量方法,并讨论了GPS定位误差对简化算法的影响。实验结果表明,所提算法的简化轨迹高效、稳定,所得到的简化轨迹与原始轨迹之间误差较小(不超过误差阈值的20%),对GPS定位误差有较好的容错能力。

    基于区域行进策略的飞机油箱检查机器人路径规划算法
    牛国臣 张成巍 李紫微
    2014, 34(8):  2415-2418.  DOI: 10.11772/j.issn.1001-9081.2014.08.2415
    摘要 ( )   PDF (528KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对类似于飞机油箱环境中连续型机器人的路径规划问题,设计基于区域行进策略的路径规划算法,结合机器人本体结构约束规划到达油箱内任意给定目标点的路径。连续型机器人具有运动灵活性,但超冗余自由度导致了三维空间规划的多解性,增加了算法的复杂度。采用降低维度的方式,通过将三维空间转化为二维平面进行规划,降低了算法的时间复杂度。将飞机油箱的单舱划分为两个区域,根据目标点所处区域位置确定规划策略。最后,基于Matlab对所提算法进行仿真,实验结果验证了算法的可行性和有效性。

    热轧圆钢生产订单接受问题优化模型与算法
    柏亮 王雷
    2014, 34(8):  2419-2423.  DOI: 10.11772/j.issn.1001-9081.2014.08.2419
    摘要 ( )   PDF (779KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对热轧圆钢的生产订单接受问题,考虑实际生产中订单提前完工惩罚和返工惩罚的影响,建立了以最大化订单总收益为优化目标的数学模型,提出了基于改进NEH算法和改进和声搜索(MHS)算法相结合的混合算法。首先改进了NEH算法用来产生初始解,再基于和声搜索算法对初始解进行优化,并引入了教与学优化(TLBO)算法思想来对和声向量进行选择和更新,进而控制迭代过程中产生的新解。同时,为了平衡算法的广度和深度搜索能力,在求解过程中动态地调整参数来保证算法的全局优化能力。基于实际生产数据的仿真实验表明,所提算法能有效提高订单总收益和订单接受率,验证了模型和算法的可行性和有效性。

    EMOEA/D-DE算法在卫星有效载荷配置中的应用
    李晖 袁文兵 熊慕舟
    2014, 34(8):  2424-2428.  DOI: 10.11772/j.issn.1001-9081.2014.08.2424
    摘要 ( )   PDF (770KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对卫星有效载荷配置问题,提出了一种基于差分进化分解的改进多目标优化算法(EMOEA/D-DE)的有效载荷配置模型。该模型将配置问题转化为以卫星数、卫星冗余度为目标的多目标优化问题(MOP),并采用EMOEA/D-DE进行求解。此外,针对随机均匀初始化会导致种群在目标空间分布过于集中的问题,采用与优化目标相结合的随机初始化方法进行改进。实验结果表明,该模型所求解集的平均差异性在0.05以内,分布度值在0.9以上,具有较好的稳定性及分布性,且改进后的算法收敛速度提升近1倍,所求解的近似Pareto前沿相对更优。

    基于优化相对主元分析的铝电解槽况诊断
    黄迪 李太福 易军 田应甫
    2014, 34(8):  2429-2433.  DOI: 10.11772/j.issn.1001-9081.2014.08.2429
    摘要 ( )   PDF (873KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对影响铝电解槽状态的参数较多且耦合性强、建立诊断模型的计算量巨大、诊断精度有限等问题,提出一种基于优化相对主元分析(ORPCA)的铝电解槽况诊断方法。利用相对主元分析(RPCA)方法在进行特征选择时的降维优势,提出一种有效的准则以确定主元的相对权重。通过遗传算法(GA)构造误报率适应度函数,考察观测样本在主元空间和残差空间里投影的变化,以获得搜索区域内最优的相对转换矩阵,使Hotelling's T2检验和预测平方差(SPE)检验的误报率降低到最小。对某厂170kA大型预焙槽的样本进行检验,实验结果表明,该方法在置信度为95%和97.5%时,T2检验误报率分别为16.79%和9.77%,SPE检验误报率分别为4.01%和1.75%。与同类算法相比,所提方法不但能准确诊断出铝电解槽中出现的异常状态,而且明显降低T2检验和SPE检验中出现误报的概率。

    具备高存储密度的新型NAND设备管理方案
    卫兵 郭玉堂 宋杰 张磊
    2014, 34(8):  2434-2437.  DOI: 10.11772/j.issn.1001-9081.2014.08.2434
    摘要 ( )   PDF (619KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对嵌入式系统中NAND设备存储密度较低的问题,提出一种高存储密度的新型设备管理方案。通过研究大量NAND存储结构和BCH校验编码设计,在页面中找到一种通用的信息存储结构模式。使得冗余区(OOD)编码满足错误纠正码(ECC)纠错能力的同时可容纳设备分区管理信息,从而将主页面全部用于数据存储,并以此为基础进行了设备读写、损益均衡机制的设计。实验结果表明,所提方案中NAND设备数据存储密度可达98%,优于当前多数主流文件系统。该方案具备很高的数据存储密度,设备读写效率和擦写寿命相对稳定,在嵌入式系统平台中具备很好的应用优势。

    基于二次奇异值分解和最小二乘支持向量机的轴承故障诊断方法
    李葵 范玉刚 吴建德
    2014, 34(8):  2438-2441.  DOI: 10.11772/j.issn.1001-9081.2014.08.2438
    摘要 ( )   PDF (738KB) ( )  
    参考文献 | 相关文章 | 计量指标

    为了解决奇异值分解(SVD)对不同信号分解的有效奇异值个数不同,而影响故障识别准确性的难题,提出了基于二次SVD和最小二乘支持向量机(LS-SVM)的故障诊断方法。该方法利用奇异值曲率谱自适应选择有效奇异值重构信号,进行二次SVD处理,获得相同个数的正交分量,求解其能量熵,并构造故障特征向量,用于LS-SVM分类模型故障识别。将该方法应用于轴承故障诊断,与利用特定个数的主奇异值作为特征向量的方法相比,准确度提高了13.34%,表明了该方法的可行性和有效性。

    从评价网络提升信任启动的准确度
    刘彬 张仁津
    2014, 34(8):  2442-2446.  DOI: 10.11772/j.issn.1001-9081.2014.08.2442
    摘要 ( )   PDF (771KB) ( )  
    参考文献 | 相关文章 | 计量指标

    为了减少电子商务平台中商品只有很少用户评价时评估商品信任值容易受到不公正、恶意评价的影响,提出一种基于评价网络评估评价可信度的信任启动方法。评价的可信度通过评估评价者对其他商品的评价得出,与评价者评价的数量、金额以及被评价商品的价格等因素有关。无评价商品的信任值来源于商品所在的商铺和商品的申明属性。当商品的评价具有足够高的可信度时,它的信任值就由足够可信的评价决定,否则部分由评价决定或按无评价的商品处理。计算、分析和测试结果表明提出的从评价网络评估评价信任度的方法同常规方法、k均值聚类方法相比产生的误差小而且对恶意评价比率不敏感,能有助于用户从电子商务平台选择值得信赖的上架初期的商品。

    基于嵌入式技术的大容量射频识别系统设计与实现
    刘占杰 赵宇 刘开华 马永涛 张艳
    2014, 34(8):  2447-2450.  DOI: 10.11772/j.issn.1001-9081.2014.08.2447
    摘要 ( )   PDF (601KB) ( )  
    参考文献 | 相关文章 | 计量指标

    针对航空读卡器存在便携性差、速度慢和标签存储容量小等问题,提出了一种基于STM32的大容量射频识别(RFID)系统设计方法。以高性能的STM32嵌入式微处理器为核心,采用新型的CR95HF射频芯片,设计了一款工作在高频(HF)频段并支持ISO 15693、ISO 18092等多种协议的新型手持式RFID读卡器,详细阐述了系统的电源、天线设计和软件的速率、误码优化。同时,设计了一款与之匹配的被动式大容量电子标签,其存储容量高达32KB,与读卡器构成大容量RFID系统。实验结果表明,与传统读卡器相比,该读卡器的读写速度提升2.2倍,误码率降低91.7%,标签容量提升255倍,为航空物流领域的快速、准确和大数据需求提供了更好的选择。

2024年 44卷 3期
刊出日期: 2024-03-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会