计算机应用 ›› 2014, Vol. 34 ›› Issue (4): 1122-1125.DOI: 10.11772/j.issn.1001-9081.2014.04.1122

• 人工智能 • 上一篇    下一篇

深度置信网络在垃圾邮件过滤中的应用

孙劲光1,蒋金叶2,孟祥福2,李秀娟3   

  1. 1. 辽宁工程技术大学 电子与信息工程学院,辽宁 葫芦岛 125105;
    2. 辽宁工程技术大学 研究生学院,辽宁 葫芦岛 125105
    3. 辽宁工程技术大学 电子与信息工程学院,辽宁 葫芦岛 125105
  • 收稿日期:2013-10-12 修回日期:2013-12-13 出版日期:2014-04-01 发布日期:2014-04-29
  • 通讯作者: 蒋金叶
  • 作者简介:孙劲光(1962-),女,辽宁阜新人,教授,博士生导师,主要研究方向:数据挖掘、图形和图像处理、人脸识别;
    蒋金叶(1989-),女,辽宁鞍山人,硕士研究生,主要研究方向:数据挖掘;
    孟祥福(1981-),男,辽宁朝阳人,副教授,博士,主要研究方向:Web数据库柔性查询与优化、信息安全;
    李秀娟(1988-),女,辽宁阜新人,硕士研究生,主要研究方向:无线通信、数据处理。
  • 基金资助:

    国家青年科学基金;基金国家科技支撑计划(矿业组合服务解决方案研究及服务模式设计)

Application of deep belief nets in spam filtering

SUN Jingguang1,JIANG Jinye2,MENG Xiangfu1,LI Xiujuan2   

  1. 1. School of Electronic and Information Engineering, Liaoning Technical University, Huludao Liaoning 125105, China
    2. Institute of Graduate, Liaoning Technical University, Huludao Liaoning 125105, China
  • Received:2013-10-12 Revised:2013-12-13 Online:2014-04-01 Published:2014-04-29
  • Contact: JIANG Jinye

摘要:

针对深层神经网络初始化方法不明确、泛化能力差而导致解决垃圾邮件过滤时效果较差的问题,提出了基于深度置信网络的分类方法。深度置信网络通过逐层无监督的方法来预训练网络,实现了网络的初始化。在LingSpam,SpamAssassin和Enron1三个广泛使用的数据集上,通过与目前最好的垃圾邮件过滤方法支持向量机(SVM)在分类性能上进行比较,实验结果表明深度置信网络的垃圾邮件过滤方法是有效的,获得了较高的准确率和召回率。

Abstract:

Concerning the problem that how to initialize the weights of deep neural networks, which resulted in poor solutions with low generalization for spam filtering, a classification method of Deep Belief Net (DBN) was proposed based on the fact that the existing spam classifications are shallow learning methods. The DBN was pre-trained with the greedy layer-wise unsupervised algorithm, which achieved the initialization of the network. The experiments were conducted on three datesets named LinsSpam, SpamAssassin and Enron1. It is shown that compared with Support Vector Machines (SVM) which is the state-of-the-art method for spam filtering in terms of classification performance, the spam filtering using DBN is feasible, and can get better accuracy and recall.

中图分类号: