计算机应用 ›› 2011, Vol. 31 ›› Issue (08): 2156-2158.DOI: 10.3724/SP.J.1087.2011.02156

• 信息安全 • 上一篇    下一篇

应用于入侵取证的改进信息增益算法

贾娴1,2,刘培玉1,2,公伟1,2   

  1. 1. 山东师范大学 山东省分布式计算机软件新技术重点实验室,济南250014
    2. 山东师范大学 信息科学与工程学院,济南250014
  • 收稿日期:2011-02-21 修回日期:2011-04-21 发布日期:2011-08-01 出版日期:2011-08-01
  • 通讯作者: 贾娴
  • 作者简介:贾娴(1984-),女,山东菏泽人,硕士研究生,主要研究方向:网络信息安全、网络安全审计;刘培玉(1960-),男,山东潍坊人,教授,博士生导师,主要研究方向:计算机网络、信息安全、网络系统规划、网络信息资源开发技术、软件开发技术;公伟(1987-),男,山东淄博人,硕士研究生,主要研究方向:网络信息安全、网络安全审计。
  • 基金资助:

    国家自然科学基金资助项目(60873247);山东省高新技术自主创新专项(2008ZZ28);山东省自然科学基金资助项目(ZR2009GZ007);山东省教育厅科技计划项目(J09LG52)

Application of improved information gain algorithm in intrusion forensics

Jian JIA1,2,Pei-yu LIU1,2,Wei GONG2   

  • Received:2011-02-21 Revised:2011-04-21 Online:2011-08-01 Published:2011-08-01
  • Contact: Jian JIA
  • Supported by:

    the National Natural Science Foundation of China under Grant;the Natural Science Foundation of Shandong Province of China under Grant

摘要: 基于信息增益算法的特征选择虽然能够较好地解决入侵取证中存在的数据高维海量问题,但由于没有考虑特征之间的关系,导致特征子集中存在着冗余特征,从而影响了入侵取证的速度和精度,由此提出一种改进的基于特征冗余度的信息增益算法。通过添加对特征之间冗余度的判断,在删除无关特征的同时过滤了冗余特征,使特征子集得到有效精简。经实验验证,该算法能有效地选择特征向量,保证检测精度,提高检测速度。

关键词: 入侵取证, 特征选择, 信息增益, 特征冗余度

Abstract: Feature selection algorithm based on the Information Gain (IG) can solve the problem of high-dimension and magnanimous data in intrusion forensics, but it neglects the correlation between features, which can lead to the redundancy of features, and affect the speed and accuracy of intrusion forensics. Therefore, an Improved Information Gain (IIG) algorithm based on feature redundancy was proposed. In the improved algorithm, the irrelevant features and the redundant features were removed by adding the judgments of redundancy between features, which effectively simplified feature subset. The experimental results show that the proposed algorithm can effectively select features, ensure detection accuracy and improve processing speed.

Key words: intrusion forensics, feature selection, Information Gain (IG), feature redundancy

中图分类号: