结合X-means聚类的自适应随机子空间组合分类算法

doi:10.3724/SP.J.1087.2013.00550

计算机应用 ›› 2013, Vol. 33 ›› Issue (02): 550-553.DOI: 10.3724/SP.J.1087.2013.00550

结合X-means聚类的自适应随机子空间组合分类算法

曹鹏¹,²,李博¹,²,栗伟¹,²,赵大哲¹,²

1. 东北大学信息科学与工程学院，沈阳 110004
2. 医学影像计算教育部重点实验室(东北大学)，沈阳 110179

收稿日期:2012-09-03 修回日期:2012-10-08 出版日期:2013-02-01 发布日期:2013-02-25
通讯作者: 曹鹏
作者简介:曹鹏(1982-)，男，辽宁沈阳人，博士研究生，主要研究方向：机器学习、影像挖掘;
李博(1985-)，男，辽宁沈阳人，博士研究生，主要研究方向：影像检索与挖掘;
栗伟(1980-)，男，辽宁沈阳人，博士研究生，主要研究方向：文本挖掘;
赵大哲(1960-)，女，辽宁沈阳人，教授，主要研究方向：软件工程、数据挖掘、医学影像处理。
基金资助:
国家自然科学基金资助项目;中央高校基本科研业务费专项资金资助项目

Adaptive random subspace ensemble classification aided by X-means clustering

CAO Peng¹,²,LI Bo¹,²,LI Wei¹,²,ZHAO Dazhe¹,²

1. College of Information Science and Engineering, Northeastern University, Shenyang Liaoning 110004, China
2. Key Laboratory of Medical Image Computing, Ministry of Education (Northeastern University), Shenyang Liaoning 110179, China

Received:2012-09-03 Revised:2012-10-08 Online:2013-02-01 Published:2013-02-25
Contact: CAO Peng

摘要/Abstract

摘要： 针对大规模数据的分类准确率低且效率下降的问题，提出一种结合X-means聚类的自适应随机子空间组合分类算法。首先使用X-means聚类方法，保持原有数据结构的同时，把复杂的数据空间自动分解为多个样本子空间进行分治学习;而自适应随机子空间组合分类器，提升了基分类器的差异性并自动确定基分类器数量，提升了组合分类器的鲁棒性及分类准确性。该算法在人工和UCI数据集上进行了测试，并与传统单分类和组合分类算法进行了比较。实验结果表明，对于大规模数据集，该方法具有更好的分类精度和健壮性，并提升了整体算法的效率。

关键词: 大规模数据集, X-means聚类, 组合分类, 随机子空间, 支持向量机

Abstract: To solve low accuracy and efficiency issues on the large-scale data classification, an adaptive random subspace ensemble classification algorithm aided by the X-means clustering was proposed. X-means clustering was adopted to separate the original data space into multiple clusters automatically, maintaining the original data structure; moreover adaptive random subspace ensemble classifier enhanced diversity of the base components and determined the size of base classifiers automatically, so as to improve the robustness and accuracy. The experimental results show that the proposed method improves the traditional single and ensemble classifiers with respect to accuracy and robustness on the large scale datasets with high dimension. Furthermore, it improves the overall efficiency of the algorithm.

Key words: large datasets, X-means clustering, ensemble classification, random subspace, Support Vector Machine (SVM

中图分类号:

曹鹏李博栗伟赵大哲. 结合X-means聚类的自适应随机子空间组合分类算法[J]. 计算机应用, 2013, 33(02): 550-553.

CAO Peng LI Bo LI Wei ZHAO Dazhe. Adaptive random subspace ensemble classification aided by X-means clustering [J]. Journal of Computer Applications, 2013, 33(02): 550-553.

[1]	谢雨, 蒋瑜, 龙超奇. 基于随机子空间的扩展隔离林算法[J]. 计算机应用, 2021, 41(6): 1679-1685.
[2]	贾鹤鸣, 姜子超, 李瑶, 孙康健. 基于改进斑点鬣狗优化算法的同步优化特征选择[J]. 计算机应用, 2021, 41(5): 1290-1298.
[3]	袁芊芊, 邓洪敏, 王晓航. 基于超像素快速模糊C均值聚类与支持向量机的柑橘病虫害区域分割[J]. 计算机应用, 2021, 41(2): 563-570.
[4]	李凯, 李洁. 基于pinball损失的结构模糊多分类支持向量机算法[J]. 《计算机应用》唯一官方网站, 2021, 41(11): 3104-3112.
[5]	陆荣秀, 陈明明, 杨辉, 朱建勇. 基于溶液图像时序特征的元素组分含量动态监测系统[J]. 计算机应用, 2021, 41(10): 3075-3081.
[6]	童林, 官铮. 改进鲸鱼优化支持向量机的交通流量模糊粒化预测[J]. 计算机应用, 2021, 41(10): 2919-2927.
[7]	张健铭, 施元昊, 徐正蓺, 魏建明. 基于误差预测的自适应UWB/PDR融合定位算法[J]. 计算机应用, 2020, 40(6): 1755-1762.
[8]	王杨, 赵红东. 基于改进粒子群优化的支持向量机与情景感知的人体活动识别[J]. 计算机应用, 2020, 40(3): 665-671.
[9]	黄功, 赵永平, 谢云龙. 基于局部密度的加权一类支持向量机算法及其在涡轴发动机故障检测中的应用[J]. 计算机应用, 2020, 40(3): 917-924.
[10]	赵一, 段兴, 谢仕义, 梁春林. 面向特定目标自识别的交通图像语义检索方法[J]. 计算机应用, 2020, 40(2): 553-560.
[11]	李卉, 杨志霞. 基于Rescaled Hinge损失函数的多子支持向量机[J]. 计算机应用, 2020, 40(11): 3139-3145.
[12]	牛晓可, 黄伊鑫, 徐华兴, 蒋震阳. 基于听皮层神经元感受野的强噪声环境下说话人识别[J]. 计算机应用, 2020, 40(10): 3034-3040.
[13]	白东颖, 易亚星, 王庆超, 余志勇. 面向概念漂移问题的渐进多核学习方法[J]. 计算机应用, 2019, 39(9): 2494-2498.
[14]	何海琳, 郑建彬, 余方利, 余烈, 詹恩奇. 基于改进鲸鱼优化算法的外骨骼机器人步态检测[J]. 计算机应用, 2019, 39(7): 1905-1911.
[15]	孔菁, 郭渊博, 刘春辉, 王一丰. 基于智能手机运动传感器的步态特征身份识别方法[J]. 计算机应用, 2019, 39(6): 1747-1752.

结合X-means聚类的自适应随机子空间组合分类算法

Adaptive random subspace ensemble classification aided by X-means clustering

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics