计算机应用 ›› 2012, Vol. 32 ›› Issue (10): 2884-2887.DOI: 10.3724/SP.J.1087.2012.02884
收稿日期:
2012-04-25
修回日期:
2012-06-05
发布日期:
2012-10-23
出版日期:
2012-10-01
通讯作者:
薛文娟
作者简介:
基金资助:
XUE Wen-juan1,2,LIU Pei-yu1,2,LIU Dong1,2
Received:
2012-04-25
Revised:
2012-06-05
Online:
2012-10-23
Published:
2012-10-01
Contact:
XUE Wen-juan
摘要: 针对Chameleon算法中采用距离函数度量数据点间的相似度,导致距离相近的两个点可能仅拥有很少的共同特征,最小二分实际操作困难,合并时需要人工指定阈值以及一旦合并完成后不能撤销的问题,对Chameleon算法进行改进,提出一种引入共享近邻加权图(WSnnG)的Chameleon算法。该算法以数据对象间的共享近邻数来衡量相似度,进一步构造WSnnG,再利用网络模块性评价函数指导最小二分,然后以结构等价相似度作为合并的依据,最后通过引入内聚度度量函数解决合并后不能撤销的问题。在UCI数据集及4个二维人造数据集上的实验结果表明,该算法在聚类精度和运行时间方面具有更好的效果。
中图分类号:
薛文娟 刘培玉 刘栋. 引入共享近邻加权图的Chameleon算法[J]. 计算机应用, 2012, 32(10): 2884-2887.
XUE Wen-juan LIU Pei-yu LIU Dong. Improved Chameleon algorithm using weighted nearest neighbors graph[J]. Journal of Computer Applications, 2012, 32(10): 2884-2887.
[1] KARYPIS G, HAN EUI-HONG, KUMAR V. Chameleon: Hierarchical clustering algorithm using dynamic modeling[J]. Computer, 1999,32(8):68-75. [2] 聂承启,喻云峰.聚类分析中Chameleon算法的研究[J].计算机科学,2006,33(8):166-168. [3] 蒋盛益,庞观松,张黎莎.Chameleon算法的改进[J].小型微型计算机系统,2010,31(8):1643-1646. [4] JIANG SHENG-YI, XU YU-MING. An efficient clustering algorithm[C]// Proceedings of 2004 International Conference on Machine Learning and Cybernetics. New York: IEEE, 2004:1513- 1518. [5] 龙真真,张策,刘飞裔,等.一种改进的chameleon算法[J].计算机工程,2009,35(20):189-191. [6] 孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008,19(1):48-61. [7] AYAD H, KAMEL M S. Refined shared nearest neighbors graph for combining multiple data clustering[C]// Advances in Intelligent Data Analysis V, LNCS 2810. Berlin: Springer, 2003: 307-318. [8] ERTOZ L, STEINBACH M, KUMAR V. A new shared nearest neighbor clustering algorithm and its applications[EB/OL].[2012-01-10].www-users.cs.umn.edu/~kumar/.../siam_hd_snn_cluster.pdf. [9] 金弟,刘杰,贾正雪,等.基于k最近邻网络的数据聚类算法[J].模式识别与人工智能,2010,23(4):546-551. [10] XU XIAOWEI, YURUK N, FENG ZHIDAN,et al. SCAN: A structural clustering algorithm for networks // KDD07: Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM,2007:824-833. [11] 金阳,左万利.一种基于动态近邻选择模型的聚类算法[J].计算机学报,2007,30(5):5756-5762. [12] 刘文凤,卿晓霞.Chameleon聚类算法的Weka实现[J].计算机系统应用,2010,19(12):246-250. [13] 马晓艳,唐雁.层次聚类算法研究[J].计算机科学,2008,34(7):34-36. [14] 张国锁,周创明,雷英杰.改进FCM聚类算法及其在入侵检测中的应用[J].JOCA,2009,29(5):1336-1338. [15] 蔡丽宏.SOM聚类算法的改进及其在文本挖掘中的应用研究[D].南京:南京航空航天大学,2011. |
[1] | 赵津, 宋文爱, 邰隽, 杨吉江, 王青, 李晓丹, 雷毅, 邱悦. 儿童阻塞性睡眠呼吸暂停计算机人脸辅助诊断综述[J]. 《计算机应用》唯一官方网站, 2021, 41(11): 3394-3401. |
[2] | 祁祥洲 邢红杰. 基于中心核对齐的多核单类支持向量机[J]. 计算机应用, 0, (): 0-0. |
[3] | 陈浩杰,范江亭,刘勇. 分布式强化学习解决动态旅行商问题[J]. 计算机应用, 0, (): 0-0. |
[4] | 郭一阳 于炯 杜旭升 杨少智 曹铭. 基于自编码器与集成学习的离群点检测算法[J]. 计算机应用, 0, (): 0-0. |
[5] | 李卓, 宋子晖, 沈鑫, 陈昕. 边缘计算支持下的移动群智感知本地差分隐私保护机制[J]. 计算机应用, 2021, 41(9): 2678-2686. |
[6] | 王周恺, 张炯, 马维纲, 王怀军. 面向高速列车监测数据的并行解压缩算法[J]. 计算机应用, 2021, 41(9): 2586-2593. |
[7] | 张妮 韩萌 王乐 李小娟 程浩东. 基于正负效用划分的高效用模式挖掘方法综述[J]. 计算机应用, 0, (): 0-0. |
[8] | 王梓森, 梁英, 刘政君, 谢小杰, 张伟, 史红周. 科研项目同行评议专家学术专长匹配方法[J]. 计算机应用, 2021, 41(8): 2418-2426. |
[9] | 赵全, 汤小春, 朱紫钰, 毛安琪, 李战怀. 大规模短时间任务的低延迟集群调度框架[J]. 计算机应用, 2021, 41(8): 2396-2405. |
[10] | 康军, 黄山, 段宗涛, 李宜修. 时空轨迹序列模式挖掘方法综述[J]. 计算机应用, 2021, 41(8): 2379-2385. |
[11] | 陈静, 毛莺池, 陈豪, 王龙宝, 王子成. 基于改进单点多盒检测器的大坝缺陷目标检测方法[J]. 计算机应用, 2021, 41(8): 2366-2372. |
[12] | 马华, 陈跃鹏, 唐文胜, 娄小平, 黄卓轩. 面向工作者能力评估的众包任务分配方法的研究进展综述[J]. 计算机应用, 2021, 41(8): 2232-2241. |
[13] | 孙蕊, 韩萌, 张春砚, 申明尧, 杜诗语. 含负项top-k高效用项集挖掘算法[J]. 计算机应用, 2021, 41(8): 2386-2395. |
[14] | 武鹏, 吴尽昭. 基于线性误差断言的推理方法[J]. 计算机应用, 2021, 41(8): 2199-2204. |
[15] | 李莉 吴怡 杨祉坤 陈云鹏. 基于分区型区块链医疗电子病历共享方案[J]. , 0, (): 0-0. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||