栏目文章信息

    第五届中国数据挖掘会议(CCDM 2014)论文 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 面向无线传感器网络的自适应数据清洗方法
    夏英 毕海洋 雷建军 裵海英
    计算机应用    2014, 34 (8): 2145-2147.   DOI: 10.11772/j.issn.1001-9081.2014.08.2145
    摘要285)      PDF (619KB)(333)    收藏

    针对无线传感器网络(WSN)数据不精确和不可靠的问题,根据感知数据的空间相关性定义了弹性空间模型,并在此基础上提出一种自适应近邻空间清洗方法(ANSA)。该方法根据感知数据波动动态调整近邻空间大小,并通过计算近邻节点测量数据的加权平均对本地数据清洗。实验结果表明,感知数据清洗后误差控制在0.5以内,与经典的加权移动平均(WMA)方法相比,所提方法的精确度更高,同时能量损耗减少约36%。

    参考文献 | 相关文章 | 多维度评价
    2. 基于LEACH的无线传感器网络混合优化协议算法
    沈梦南 耿生玲 刘震
    计算机应用    2014, 34 (8): 2148-2154.   DOI: 10.11772/j.issn.1001-9081.2014.08.2148
    摘要234)      PDF (1057KB)(533)    收藏

    在无线传感器网络(WSN)协议研究中,降低节点的能量损耗、延长节点的使用寿命是研究的关键问题。针对无线传感器网络中传统LEACH协议在分簇机制及数据通信方面的不足,提出了一种混合优化的改进协议——HOBDE-LEACH。新的协议采用先分簇再选举簇头的策略,提出覆盖半径种子扫描成簇算法(CR-SSCA)进行快速分簇,保证对区域的全覆盖;网络运行期间结合能量和距离考虑负载均衡,分阶段采用不同的簇头选举和通信机制。仿真实验结果表明,与LEACH协议相比,HOBDE-LEACH的第一个节点死亡的轮循次数延长了66%,50%节点死亡时的网络轮循次数延长了20%;与LEACH-EI协议相比,所提协议的第一节点死亡的轮循次数延长了50%,50%节点死亡的网络轮循次数延长了19%。改进后的协议能有效地均衡网络负载和簇头节点能量消耗,更合理地分布簇头节点,延长网络生命周期。

    参考文献 | 相关文章 | 多维度评价
    3. 数据驱动的置信规则库构建与推理方法
    余瑞银 杨隆浩 傅仰耿
    计算机应用    2014, 34 (8): 2155-2160.   DOI: 10.11772/j.issn.1001-9081.2014.08.2155
    摘要559)      PDF (1042KB)(465)    收藏

    针对Liu等(LIU J, MARTINEZ L, CALZADA A, et al. A novel belief rule base representation, generation and its inference methodology. Knowledge-Based Systems, 2013, 53: 129-141)提出的扩展置信规则库(BRB)推理精度不够高的问题,提出了一种改进的规则库构建与推理方法。在Liu等提出的规则库构建方法的基础上,给出了一种新的生成规则前件与计算规则权重的方法;同时为了避免大量不必要的规则被激活,引入80/20法则改进规则激活策略,并最终形成完整的置信规则库构建与推理方法。通过输油管道检漏的实例对所提方法的准确性和效率进行对比分析。实验结果表明,所提方法能够在保证低耗时的同时,将系统平均绝对误差(MAE)降低到0.17342,具有较高的效率和精度。

    参考文献 | 相关文章 | 多维度评价
    4. 基于变速粒子群优化的置信规则库参数训练方法
    苏群 杨隆浩 傅仰耿 吴英杰 巩晓婷
    计算机应用    2014, 34 (8): 2161-2165.   DOI: 10.11772/j.issn.1001-9081.2014.08.2161
    摘要329)      PDF (912KB)(559)    收藏

    针对置信规则库(BRB)中参数优化模型的求解问题,引入群智能算法中的粒子群优化(PSO)算法,提出一种新的参数训练方法。将参数优化模型求解问题转换为带约束条件的非线性优化问题,在迭代寻优时限制粒子在搜索空间中,对失去速度的粒子重新赋予速度,维持种群中粒子多样性,从而实现参数训练。在输油管道检漏问题仿真实验中,训练后系统的平均绝对误差(MAE)为0.166478。实验结果表明,所提方法有理想的收敛精度,可用于置信规则库参数训练。

    参考文献 | 相关文章 | 多维度评价
    5. 新的模糊聚类有效性指标
    郑宏亮 徐本强 赵晓慧 邹丽
    计算机应用    2014, 34 (8): 2166-2169.   DOI: 10.11772/j.issn.1001-9081.2014.08.2166
    摘要265)      PDF (582KB)(305)    收藏

    在经典的模糊C均值(FCM)算法中,聚类数需要预先给出,否则算法无法工作,这在一定程度上限制了FCM算法的应用范围。针对FCM算法中聚类数需要预先设定问题,提出了一种新的模糊聚类有效性指标。首先,通过运行FCM算法得到隶属度矩阵;然后,通过隶属度矩阵计算类内紧密性和类间重叠性;最后,利用类内的紧密性和类间的重叠性定义了一个新的聚类有效性指标。该指标克服了FCM算法中类数需要预先设定的缺点,利用该指标可以发现最符合数据自然分布的类的数目。通过对人工数据集和实际数据集的测试表明,对于模糊因子取1.8,2.0和2.2三个不同的常用值,均能发现最优聚类数。

    参考文献 | 相关文章 | 多维度评价
    6. 基于容差优势关系的排序方法及其应用
    陈万翠 吕跃进 翁世洲
    计算机应用    2014, 34 (8): 2170-2174.   DOI: 10.11772/j.issn.1001-9081.2014.08.2170
    摘要280)      PDF (715KB)(506)    收藏

    针对序信息系统下经典优势关系过于严格从而可能导致排序方法失效的问题,首先,提出了容差优势关系的概念并对其相关性质予以研究;然后,基于容差优势关系,给出优势度的定义,并提出基于容差优势关系的方案排序方法;最后,将该方法应用于智能电网的综合评价中。实验结果表明:相比经典优势关系,容差优势关系对数据具有更强的容错能力,排序结果具有较强的区分度。容差优势关系的提出,能有效避免经典优势关系因属性个数较多、属性值互有优劣时可能引起的失效问题。

    参考文献 | 相关文章 | 多维度评价
    7. 并行挖掘频繁项目集新算法——MREclat
    章志刚 吉根林 唐梦梦
    计算机应用    2014, 34 (8): 2175-2178.   DOI: 10.11772/j.issn.1001-9081.2014.08.2175
    摘要323)      PDF (605KB)(423)    收藏

    针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。

    参考文献 | 相关文章 | 多维度评价
    8. 基于链接重要性和数据场的链接预测算法
    陈巧玉 班志杰
    计算机应用    2014, 34 (8): 2179-2183.   DOI: 10.11772/j.issn.1001-9081.2014.08.2179
    摘要369)      PDF (766KB)(462)    收藏

    针对现有基于节点相似性的链接预测方法忽略了网络拓扑本身链接强度的信息,带权的拓扑路径方法中权值较难确定等缺陷,提出一种基于链接重要性和数据场的链接预测算法。首先,将所有链接边赋予不同的链接权重;其次,考虑潜在链接节点间的相互影响,对部分没有链接的节点进行链接预估计;最后,利用数据场势函数计算两节点间的相似值。在典型的网络数据进行的实验结果表明,所提方法在分类指标和推荐指标中都有很好的表现:以AUC为评价指标时,比同复杂度的局部路径(LP)算法提高了3到6个百分点;以DCG为评价指标时比LP算法提高了1.5到2.5个DCG值。算法整体上提高了预测准确性,且由于参数确定简单,复杂度又不高,在实际中易于部署。

    参考文献 | 相关文章 | 多维度评价
    9. 基于集成学习的无监督离散化算法
    徐盈盈 钟才明
    计算机应用    2014, 34 (8): 2184-2187.   DOI: 10.11772/j.issn.1001-9081.2014.08.2184
    摘要227)      PDF (752KB)(437)    收藏

    模式识别与机器学习的一些算法只能处理离散属性值,而在现实生活中的很多数据具有连续的属性值,针对数据离散化的问题提出了一种无监督的方法。首先,使用K-means方法将数据集进行划分得到类别信息;然后,应用有监督的离散化方法对划分后的数据离散化,重复上述过程以得到多个离散化的结果,再将这些结果进行集成;最后,将集成得到的最小子区间进行合并,这里根据数据间的邻居关系选择优先合并的维度及相邻区间。其中,通过数据间的近邻关系自动寻求子区间数目,尽可能保持其内在结构关系不变。将离散后的数据应用于聚类算法,如谱聚类算法,并对聚类后的效果进行评价。实验结果表明,该算法聚类精确度比其他4种方法平均提高约33%,表明了该算法的可行性和有效性。通过该算法得到的离散化数据可应用于一些数据挖掘算法,如ID3决策树算法。

    参考文献 | 相关文章 | 多维度评价
    10. 中文微博语料情感类别自动标注方法
    阳爱民 周咏梅 周剑峰
    计算机应用    2014, 34 (8): 2188-2191.   DOI: 10.11772/j.issn.1001-9081.2014.08.2188
    摘要620)      PDF (611KB)(409)    收藏

    针对大规模微博语料手动标注困难的问题,提出了中文微博语料情感类别自动标注的方法,包括基于关键词的、基于概率求和的和基于概率乘积的3种自动标注方法和一种集成标注方法。自动标注时首先分别使用3种标注方法进行标注,得到3种标注结果;然后,采用标注方法集成的策略,对3种标注的结果通过投票的方式决定最终的标注结果。通过设计自动标注实验系统进行实验,实验结果验证了所提方法的可行性和有效性。实验结果表明,单个标注方法的准确率均在70%以上,投票方法的准确率达90%以上。

    参考文献 | 相关文章 | 多维度评价
    11. 电影本体的构建与一致性分析
    高小龙 朱信忠 赵建民 曹存根 徐慧英 吴德
    计算机应用    2014, 34 (8): 2192-2196.   DOI: 10.11772/j.issn.1001-9081.2014.08.2192
    摘要244)      PDF (881KB)(498)    收藏

    针对移动网络对电影服务系统提出的更高要求和电影领域知识描述的不足,阐述构建电影领域本体(MO)的必要性和可行性:首先,概述电影本体的对象和组成,提出构建电影领域本体模型的原则和方法,利用OWL和Protege 4.1构建模型;其次,详细说明电影本体的类、属性、实例、公理和推理规则的具体表述;最后,分析电影本体的一致性,包括类间关系的一致性分析和基于公理的一致性分析。

    参考文献 | 相关文章 | 多维度评价
    12. 基于规则的汉语兼类词标注方法
    李华栋 贾真 尹红风 杨燕
    计算机应用    2014, 34 (8): 2197-2201.   DOI: 10.11772/j.issn.1001-9081.2014.08.2197
    摘要209)      PDF (746KB)(358)    收藏

    针对目前汉语兼类词标注的准确率不高的问题,提出了规则与统计模型相结合的兼类词标注方法。首先,利用隐马尔可夫、最大熵和条件随机场3种统计模型进行兼类词标注;然后,将改进的互信息算法应用到词性(POS)标注规则的获取上,通过计算目标词前后词单元与目标词的相关性获得词性标注规则;最后,将获取的规则与基于统计模型的词性标注算法结合起来进行兼类词标注。实验结果表明加入规则算法之后,平均词性标注准确率提升了5%左右。

    参考文献 | 相关文章 | 多维度评价
    13. 基于Agent社会圈子网络的语言竞争模型
    王超 毕贵红 张寿明 韦春桃
    计算机应用    2014, 34 (8): 2202-2208.   DOI: 10.11772/j.issn.1001-9081.2014.08.2202
    摘要223)      PDF (1102KB)(426)    收藏

    语言传播网络是一种典型的社会网络,语言网络的结构和动态性对语言的竞争与传播具有重要影响。鉴于此特点,提出以同一地区的语言竞争现象作为研究对象,利用基于Agent的社会圈子网络来构建更能接近实际的语言网络。社会网络中个体网络的结构参数和整体网络的参数都具有良好的社会网络特点。网络中的Agent可以被赋予不同大小的社会圈子,Agent可以在网络中移动、新生和死亡,进而引起社会网络旧关系的断开和新关系的建立。网络中的Agent的语言类型代表了单语X、单语Y和双语Z(单语X和单语Y)三类,语言的传播模型为横向传播和纵向传播。在分析了语言地位、吸引因子、横纵向传播的最高比例、语言的人口比例对语言竞争影响的基础上,重点分析了社会交往半径和社会流动性对语言竞争的影响。仿真结果表明,与静态社会网络模型相比,所提模型更加贴近实际社会,能够有效提高语言之间共存的可能性,为研究濒危语言的保存提供一个较好的环境。

    参考文献 | 相关文章 | 多维度评价
    14. 基于粗糙集的微博用户性别识别
    黄发良 熊金波 黄添强 刘西蒙
    计算机应用    2014, 34 (8): 2209-2211.   DOI: 10.11772/j.issn.1001-9081.2014.08.2209
    摘要226)      PDF (487KB)(497)    收藏

    针对微博消息往往会不同程度表现出性别倾向性的特点,从消息内容挖掘的角度出发提出了一种基于粗糙集的微博用户性别识别算法。设计了一种基于容差粗集的微博消息表示模型(TRSRM),有效地刻画微博消息的性别特征。实验结果表明,在1000个真实微博用户的微博消息的测试集下,所提模型的准确率比特征项频数表示模型平均提高了7%,取得了更好的识别效果。

    参考文献 | 相关文章 | 多维度评价
    15. 基于特征向量的最小二乘支持向量机PM2.5浓度预测模型
    李龙 马磊 贺建峰 邵党国 易三莉 相艳 刘立芳
    计算机应用    2014, 34 (8): 2212-2216.   DOI: 10.11772/j.issn.1001-9081.2014.08.2212
    摘要472)      PDF (781KB)(1156)    收藏

    针对大气中细颗粒物(PM2.5)浓度预测的问题,提出一种预测模型。首先,通过引入综合气象指数综合考虑风力、湿度、温度等因素;然后,结合实际二氧化硫(SO2)浓度、二氧化氮(NO2)浓度、一氧化碳(CO)浓度和PM10浓度等,构成特征向量;最后,利用特征向量和PM2.5浓度数据来建立最小二乘支持向量机(LS-SVM)预测模型。经2013年城市A和城市B环境监测中心的数据预测分析表明,引入综合气象指数后预测的准确性提高,误差降低近30%。说明该模型能够较为准确地预测PM2.5浓度,并具有较高的泛化能力。此外还分析了PM2.5浓度与住院率、医院门诊量的关系,发现了它们的高度相关性。

    参考文献 | 相关文章 | 多维度评价
    16. 基于滑动窗口预测的水文时间序列异常检测
    余宇峰 朱跃龙 万定生 关兴中
    计算机应用    2014, 34 (8): 2217-2220.   DOI: 10.11772/j.issn.1001-9081.2014.08.2217
    摘要301)      PDF (791KB)(905)    收藏

    针对水文时间序列分析与决策中存在的数据质量问题,提出了基于滑动窗口预测的水文时间序列异常检测算法。首先基于滑动窗口对时间序列进行子序列分割,再以子序列为基础建立预测模型对未来值进行预测,并将预测值和实测值间差异范围大于预设阈值的序列点判定为异常。探讨了算法中的滑动窗口和参数设置,并以实例数据对算法进行了验证。实验结果表明,所提算法不仅能够有效挖掘出水文时间序列中的异常点,而且将异常检测的灵敏度和特异度分别提高到80%和98%以上。

    参考文献 | 相关文章 | 多维度评价
    17. 灰度累积投影直方图在胎冠缺陷检测中的应用
    韩延彬 王杰 夏英杰 李金屏
    计算机应用    2014, 34 (8): 2221-2226.   DOI: 10.11772/j.issn.1001-9081.2014.08.2221
    摘要351)      PDF (950KB)(442)    收藏

    针对轮胎胎冠帘线搭接缺陷的自动检测问题,提出一种基于胎冠X射线图像的检测方法。首先,依据胎冠的X射线影像和投影角计算胎冠成像的灰度累积投影曲线;然后,计算曲线的局部峰值能量分布;其次,采用前n个最大峰值能量构造投影曲线的能量特征向量,并利用支持向量机(SVM)分类器进行最大投影曲线的判别;最后,利用位置反演计算对缺陷进行定位。仿真实验结果表明,所提方法可以对生产过程中采集的1000幅胎冠图像进行有效的缺陷检测,其最高检测正确率可达97.7%。

    参考文献 | 相关文章 | 多维度评价
    18. 基于核非负稀疏表示的人脸识别
    薄纯娟 张汝波 刘冠群 汪雨哲
    计算机应用    2014, 34 (8): 2227-2230.   DOI: 10.11772/j.issn.1001-9081.2014.08.2227
    摘要296)      PDF (615KB)(390)    收藏

    提出了一种新颖的核非负稀疏表示(KNSR)算法,将其用于人脸识别,主要贡献有如下3个方面:首先,在稀疏表示(SR)的基础上引入了对表示系数的非负限制,并利用核函数来描述样本之间的非线性关系,提出了相应的目标函数;其次,提出了一种乘性梯度下降迭代算法对提出的目标函数进行优化求解,该算法在理论上可以保证收敛到全局最优值;最后,利用局部二元特征和汉明核来建模人脸样本的非线性关系,从而实现鲁棒的人脸识别。实验结果表明,在具有挑战性的人脸库上所提算法识别率均高于最近邻(NN)算法、支持向量机(SVM)、最近子空间(NS)、SR和协同表示(CR)算法,在YaleB和AR数据库上都达到了大约99%的识别率。

    参考文献 | 相关文章 | 多维度评价
    19. 基于联合双边滤波器的Kinect深度图像滤波算法
    李知菲 陈源
    计算机应用    2014, 34 (8): 2231-2234.   DOI: 10.11772/j.issn.1001-9081.2014.08.2231
    摘要824)      PDF (846KB)(744)    收藏

    针对Kinect镜头采集的深度图像一般有噪声和黑洞现象,直接应用于人体动作跟踪和识别等系统中效果差的问题,提出一种基于联合双边滤波器的深度图像滤波算法。算法利用联合双边滤波原理,将Kinect镜头同一时刻采集的深度图像和彩色图像作为输入,首先,用高斯核函数计算出深度图像的空间距离权值和RGB彩色图像的灰度权值;然后,将这两个权值相乘得到联合滤波权值,并利用快速高斯变换替换高斯核函数,设计出联合双边滤波器;最后,用此滤波器的滤波结果与噪声图像进行卷积运算实现Kinect深度图像滤波。实验结果表明,所提算法应用在人体动作识别和跟踪系统后,可显著提高在背景复杂场景中的抗噪能力,识别正确率提高17.3%,同时所提算法的平均耗时为371ms,远低于同类算法。所提算法保持了联合双边滤波平滑保边的优点,由于引入彩色图像作为引导图像,去噪的同时也能对黑洞进行修补,因此该算法在Kinect深度图像上的去噪和修复效果优于经典的双边滤波算法和联合双边滤波算法,且实时性强。

    参考文献 | 相关文章 | 多维度评价
2024年 44卷 4期
刊出日期: 2024-04-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会