计算机应用 ›› 2014, Vol. 34 ›› Issue (8): 2184-2187.DOI: 10.11772/j.issn.1001-9081.2014.08.2184
• 第五届中国数据挖掘会议(CCDM 2014)论文 • 上一篇 下一篇
收稿日期:
2014-04-30
修回日期:
2014-05-08
出版日期:
2014-08-01
发布日期:
2014-08-10
通讯作者:
徐盈盈
作者简介:
基金资助:
国家自然科学基金资助项目
XU Yingying1,2,ZHONG Caiming1,2
Received:
2014-04-30
Revised:
2014-05-08
Online:
2014-08-01
Published:
2014-08-10
Contact:
XU Yingying
摘要:
模式识别与机器学习的一些算法只能处理离散属性值,而在现实生活中的很多数据具有连续的属性值,针对数据离散化的问题提出了一种无监督的方法。首先,使用K-means方法将数据集进行划分得到类别信息;然后,应用有监督的离散化方法对划分后的数据离散化,重复上述过程以得到多个离散化的结果,再将这些结果进行集成;最后,将集成得到的最小子区间进行合并,这里根据数据间的邻居关系选择优先合并的维度及相邻区间。其中,通过数据间的近邻关系自动寻求子区间数目,尽可能保持其内在结构关系不变。将离散后的数据应用于聚类算法,如谱聚类算法,并对聚类后的效果进行评价。实验结果表明,该算法聚类精确度比其他4种方法平均提高约33%,表明了该算法的可行性和有效性。通过该算法得到的离散化数据可应用于一些数据挖掘算法,如ID3决策树算法。
中图分类号:
徐盈盈 钟才明. 基于集成学习的无监督离散化算法[J]. 计算机应用, 2014, 34(8): 2184-2187.
XU Yingying ZHONG Caiming. Unsupervised discretization algorithm based on ensemble learning[J]. Journal of Computer Applications, 2014, 34(8): 2184-2187.
[1]YANG A, ZHOU Y, LIN J. A method of Chinese texts sentiment classification based on Bayesian algorithm [J]. Applied Mechanics and Materials, 2012, 263/264/265/266: 2185-2190. |
[1] | 吴军 欧阳艾嘉 张琳. 基于影响度的统计显著序列模式挖掘算法[J]. 计算机应用, 0, (): 0-0. |
[2] | 张璐 方春 祝铭. 基于Res2Net-YOLACT和融合特征的室内跌倒检测算法[J]. 计算机应用, 0, (): 0-0. |
[3] | 殷雨昌 王洪元 陈莉 冯尊登 肖宇. 基于单标注样本的多损失学习与联合度量视频行人重识别[J]. 计算机应用, 0, (): 0-0. |
[4] | 胡军 许正康 刘立 钟福金 张清华. 融合多粒度社区信息的网络嵌入方法[J]. 计算机应用, 0, (): 0-0. |
[5] | 李润泽 孙雪姣. 基于时间条件提取序列的数据流偏好查询[J]. 计算机应用, 0, (): 0-0. |
[6] | 罗圣钦 陈金怡 李洪均. 基于注意力机制的多尺度残差UNet实现乳腺癌灶分割[J]. 计算机应用, 0, (): 0-0. |
[7] | 曹一珉 蔡磊 高敬阳. 基于生成对抗网络的基因数据生成方法[J]. 计算机应用, 0, (): 0-0. |
[8] | 陈冲 闫珠 赵继轩 何为 梁华庆. 基于集合经验模态分解和长短期记忆网络的催化裂化装置NOx排放预测[J]. 计算机应用, 0, (): 0-0. |
[9] | 徐光柱 林文杰 陈莎 匡婉 雷帮军 周军. U-Net与自适应阈值脉冲耦合神经网络相结合的眼底血管分割方法[J]. 计算机应用, 0, (): 0-0. |
[10] | 杨鼎康 黄帅 王顺利 翟鹏 李一丹 张立华. 基于对抗生成网络和网络集成的面部表情识别方法EE-GAN[J]. 计算机应用, 0, (): 0-0. |
[11] | 李讷 徐光柱 雷帮军 马国亮 石勇涛. 交通道路行驶车辆车标识别算法[J]. 计算机应用, 0, (): 0-0. |
[12] | 孟杰 王莉 杨延杰 廉飚. 基于多模态深度融合的虚假信息检测[J]. 计算机应用, 0, (): 0-0. |
[13] | 秦庭威 赵鹏程 秦品乐 曾建朝 柴锐 黄永琦. 基于残差注意力机制的点云配准算法[J]. 计算机应用, 0, (): 0-0. |
[14] | 鲁永帅 唐英杰 马鑫然. 基于深度特征融合的无纺布低对比度浆丝缺陷检测方法[J]. 计算机应用, 0, (): 0-0. |
[15] | 王宇航 周永霞 吴良武. 基于高斯函数的池化算法[J]. 计算机应用, 0, (): 0-0. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||