基于信息熵的支持向量数据描述分类

doi:10.3724/SP.J.1087.2011.01114

计算机应用 ›› 2011, Vol. 31 ›› Issue (04): 1114-1116.DOI: 10.3724/SP.J.1087.2011.01114

基于信息熵的支持向量数据描述分类

何伟成,方景龙

杭州电子科技大学计算机学院，杭州310018

收稿日期:2010-09-29 修回日期:2010-11-25 发布日期:2011-04-08 出版日期:2011-04-01
通讯作者: 何伟成
作者简介:何伟成(1986-)，男，浙江金华人，硕士研究生，主要研究方向：模式识别、支持向量机；
方景龙(1964-)，男，江西景德镇人，研究员，主要研究方向：模式识别、支持向量机。

Classification method for SVDD based on information entropy

Wei-cheng HE,Jing-long FANG

School of Computer Science, Hangzhou Dianzi University, Hangzhou Zhejiang 310018, China

Received:2010-09-29 Revised:2010-11-25 Online:2011-04-08 Published:2011-04-01
Contact: Wei-cheng HE

摘要/Abstract

摘要： 针对现有的支持向量数据描述(SVDD)在解决分类问题时通常存在盲目性和有偏性，在研究信息熵和SVDD分类理论的基础上，提出了改进两类分类问题的E-SVDD算法。首先对两类样本数据分别求出其熵值；然后根据熵值大小决定将哪类放在球内；最后结合两类样本容量以及各自的熵值所提供的分布信息，对SVDD算法中的C值重新进行定义。采用该算法对人工样本集和UCI数据集进行实验，实验结果验证了算法的可行性和有效性。

关键词: 信息熵, 分布特性, 支持向量数据描述, 分类

Abstract: Most of Support Vector Data Description (SVDD) methods have blindness and bias issues when working on two-class problems. The authors proposed a new SVDD method based on information entropy. In this algorithm, firstly, the entropy values were resolved respectively of the two classes of samples. Secondly, according to the size of the value, one class was placed inside the ball. Finally, the penalty was given based on the information provided by the sizes of the two sample data and their entropy values. The efficiency of this algorithm was verified by using artificial data and UCI datasets for the data imbalanced classification problem. The experimental results on artificial data sets and UCI data sets show the feasibility and effectiveness of the proposed method.

Key words: information entropy, distribution character, Support Vector Data Description (SVDD), classification

中图分类号:

TP181

何伟成方景龙. 基于信息熵的支持向量数据描述分类[J]. 计算机应用, 2011, 31(04): 1114-1116.

Wei-cheng HE Jing-long FANG. Classification method for SVDD based on information entropy[J]. Journal of Computer Applications, 2011, 31(04): 1114-1116.

[1]	黄于欣, 徐佳龙, 余正涛, 侯书楷, 周家啟. 基于生成提示的无监督文本情感转换方法[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2667-2673.
[2]	孙淳, 胡春龙, 黄树成. 一致性保留的集成排序年龄估计方法[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2381-2386.
[3]	冷强奎, 孙薛梓, 孟祥福. 基于样本势和噪声进化的不平衡数据过采样方法[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2466-2475.
[4]	张全梅, 黄润萍, 滕飞, 张海波, 周南. 融合异构信息的自动国际疾病分类编码方法[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2476-2482.
[5]	王东炜, 刘柏辰, 韩志, 王艳美, 唐延东. 基于低秩分解和向量量化的深度网络压缩方法[J]. 《计算机应用》唯一官方网站, 2024, 44(7): 1987-1994.
[6]	葛焌迟, 赵为华. 矩阵数据基于鲁棒主成分分析的距离加权判别分析[J]. 《计算机应用》唯一官方网站, 2024, 44(7): 2073-2079.
[7]	陆潜慧, 张羽, 王梦灵, 吴庭伟, 单玉忠. 基于改进循环池化网络的核电装备质量文本分类模型[J]. 《计算机应用》唯一官方网站, 2024, 44(7): 2034-2040.
[8]	翟飞宇, 马汉达. 基于DenseNet的经典-量子混合分类模型[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1905-1910.
[9]	黎施彬, 龚俊, 汤圣君. 基于Graph Transformer的半监督异配图表示学习模型[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1816-1823.
[10]	余新言, 曾诚, 王乾, 何鹏, 丁晓玉. 基于知识增强和提示学习的小样本新闻主题分类方法[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1767-1774.
[11]	李旭, 何玉林, 崔来中, 黄哲学, PHILIPPE Fournier‑Viger. 基于大数据随机样本划分的分布式观测点分类器[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1727-1733.
[12]	杨冬菊, 胡成富. 基于改进TextRank的科技文本关键词抽取方法[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1720-1726.
[13]	姚迅, 秦忠正, 杨捷. 生成式标签对抗的文本分类模型[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1781-1785.
[14]	袁子璇, 翁小清, 戈宁振. 基于正交局部保持映射和成本优化的多变量时间序列早期分类模型[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1832-1841.
[15]	李鑫, 孟乔, 皇甫俊逸, 孟令辰. 基于分离式标签协同学习的YOLOv5多属性分类[J]. 《计算机应用》唯一官方网站, 2024, 44(5): 1619-1628.

基于信息熵的支持向量数据描述分类

Classification method for SVDD based on information entropy

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics