基于特征加权朴素贝叶斯算法的网络用户识别
刘磊1 ,陈兴蜀1 ,尹学渊1 ,段意2 ,吕昭1
1. 四川大学 计算机学院,成都 610065 2. 四川大学 计算机学院,四川 成都610065
Network User Identify On Feature Weighting Naive Bayes Classification Algorithm
LIU Lei,CHEN Xing-shu,YIN Xue-yuan,DUAN Yi,LV Zhao
College of Computer Science, Sichuan University, Chengdu Sichuan 610065, China
摘要 基于网络用户的访问记录,提出了采用特征加权的朴素贝叶斯分类算法对用户进行识别。首先利用基于WinPcap框架的数据采集系统对用户访问记录进行采集,通过分析记录从5个方面对用户特征进行统计,并经过筛选后对特征进行选取,最后采用特征加权的朴素贝叶斯分类算法对3300个测试样本进行识别,识别率达到了85.73%。实验结果表明该算法能够有效实现对网络用户身份的识别。
关键词 :
用户识别 ,
朴素贝叶斯分类器 ,
特征加权 ,
特征选择 ,
数据采集
Abstract :Based on the access logs of network users, Feature Weighting Naive Bayes Classification(FWNBC) algorithm is used to identify users. Firstly, the data acquisition system based on WinPcap framework was used to collect the access logs of network users, characteristics are counted from five aspects by analyzing these access logs, and then selected after filtering, at last the FWNBC algorithm is used to identify the 3300 samples, and the recognition rate reached 85.73%.The experiment results show that this algorithm is effective to identify the identity of network users.
Key words :
user identification
Naive Bayes Classifier
feature weighting
feature selection
data acquisition
收稿日期: 2011-06-24
出版日期: 2011-12-12
基金资助: 国家973计划项目;国家242信息安全专项
通讯作者:
刘磊
E-mail: 86826505@qq.com
引用本文:
刘磊 陈兴蜀 尹学渊 段意 吕昭. 基于特征加权朴素贝叶斯算法的网络用户识别[J]. 计算机应用, 2011, 31(12): 3268-3270.
LIU Lei CHEN Xing-shu YIN Xue-yuan DUAN Yi LV Zhao. Network User Identify On Feature Weighting Naive Bayes Classification Algorithm. Journal of Computer Applications, 2011, 31(12): 3268-3270.
链接本文:
http://www.joca.cn/CN/ 或 http://www.joca.cn/CN/Y2011/V31/I12/3268
[1]
支晓斌, 许朝晖. 鲁棒的特征权重自调节软子空间聚类算法 [J]. 计算机应用, 2015, 35(3): 770-774.
[2]
高富强, 陈春江, 兰扬, 安康. γ射线工业CT数据采集传输系统 [J]. 计算机应用, 2015, 35(1): 276-278,282.
[3]
刘韬 陈毅红 谭颖 陈雅茜. 基于无线传感器网络的分布式时分多址调度策略 [J]. 计算机应用, 2014, 34(1): 8-12.
[4]
李太勇 王会军 吴江 张智林 唐常杰. 基于稀疏贝叶斯学习的个人信用评估 [J]. 计算机应用, 2013, 33(11): 3094-3096.
[5]
张毅 黄聪 罗元. 基于改进朴素贝叶斯分类器的康复训练行为识别方法 [J]. 计算机应用, 2013, 33(11): 3187-3189.
[6]
冶晓隆 兰巨龙 郭通. 基于主成分分析禁忌搜索和决策树分类的异常流量检测方法 [J]. 计算机应用, 2013, 33(10): 2846-2850.
[7]
李泽安 陈建平 章雅娟 赵为华. 高维数据挖掘中特征选择的稳健方法 [J]. 计算机应用, 2013, 33(08): 2194-2197.
[8]
张宗飞. 基于量子进化算法的网络入侵检测特征选择 [J]. 计算机应用, 2013, 33(05): 1357-1361.
[9]
曹鹏 李博 栗伟 赵大哲. 基于粒子群优化的不均衡数据学习 [J]. 计算机应用, 2013, 33(03): 789-792.
[10]
王佳奕 葛玉荣. 基于Contourlet变换和支持向量机的纹理识别方法 [J]. 计算机应用, 2013, 33(03): 677-679.
[11]
陈劲 段发阶 蒋佳佳 常宗杰 华香凝 李彦超. 用于水听器线列阵的精密时钟同步方法 [J]. 计算机应用, 2013, 33(02): 600-602.
[12]
杨泽平 刘德强 王茜 向强铭. 基于地理信息系统技术的数据采集与监视控制系统设计 [J]. 计算机应用, 2013, 33(02): 567-574.
[13]
黄莉莉 汤进 孙登第 罗斌. 基于多标签ReliefF的特征选择算法 [J]. 计算机应用, 2012, 32(10): 2888-2890.
[14]
张健飞 陈黎飞 郭躬德. 检测迷惑恶意代码的层次化特征选择方法 [J]. 计算机应用, 2012, 32(10): 2761-2767.
[15]
李文闯 章永平 潘瑜春. 移动地理信息系统中的多源异构数据融合模型 [J]. 计算机应用, 2012, 32(09): 2672-2674.