基于相对Hamming距离的Web聚类算法

doi:10.3724/SP.J.1087.2011.01387

计算机应用 ›› 2011, Vol. 31 ›› Issue (05): 1387-1390.DOI: 10.3724/SP.J.1087.2011.01387

基于相对Hamming距离的Web聚类算法

李彬¹,汪天飞²,刘才铭¹,张建东¹

1.乐山师范学院智能信息处理及应用实验室,四川乐山 614004
2.乐山师范学院数学与信息科学学院,四川乐山 614004

收稿日期:2010-11-02 修回日期:2011-01-10 发布日期:2011-05-01 出版日期:2011-05-01
通讯作者: 李彬
作者简介:李彬(1979-),女,四川乐山人,讲师,硕士,主要研究方向:数据挖掘、网络安全;汪天飞(1973-),男,四川乐山人,副教授,硕士,主要研究方向:组合与图论、数学建模;刘才铭(1979-),男,四川武胜人,副研究员,博士,主要研究方向:网络安全、人工智能;张建东(1980-),男,四川资阳人,讲师,硕士,主要研究方向:网络安全。
基金资助:
四川省教育厅基金资助项目(07ZB031;10ZC106)。

Web clustering algorithm based on relative hamming distance

LI Bin¹, WANG Tian-fei², LIU Cai-ming¹, ZHANG Jian-dong¹

1.Laboratory of Intelligent Information Processing and Application, Leshan Normal University, Leshan Sichuan 614004, China
2. College of Mathematics and Information Science, Leshan Normal University, Leshan Sichuan 614004, China

Received:2010-11-02 Revised:2011-01-10 Online:2011-05-01 Published:2011-05-01

摘要/Abstract

摘要： 针对Web使用挖掘中聚类结果准确性不高的问题,提出了一种改进的基于相对Hamming距离和类不一致度的聚类算法。该算法首先以Web站点的URL为行、以UserID为列建立关联矩阵,元素值为用户的访问次数;然后,对所建立关联矩阵的列向量或行向量进行相似性度量,获得相似客户群体或相关页面。实验表明,该算法具有较高的准确性。

关键词: 聚类算法, 相对Hamming距离, 不一致度, Web使用挖掘, 网络安全

Abstract: Concerning the clustering inaccuracy in Web usage mining, an improved clustering algorithm based on relative Hamming distance and conflicting degree was given. In this algorithm, a URL-UserID associated matrix was set up, where URL and UserID of Web site were taken as row and column respectively, and each element's value of this matrix was the user's hits. Then, similar customer groups or relevant Web pages were obtained by measuring the similarity between column vectors or between row vectors of the associated matrix. The experiments show that the new algorithm is more accurate.

Key words: clustering algorithm, relative Hamming distance, conflicting degree, Web usage mining, network security

李彬汪天飞刘才铭张建东. 基于相对Hamming距离的Web聚类算法[J]. 计算机应用, 2011, 31(05): 1387-1390.

LI Bin WANG Tian-fei LIU Cai-ming ZHANG Jian-dong. Web clustering algorithm based on relative hamming distance[J]. Journal of Computer Applications, 2011, 31(05): 1387-1390.

[1]	王月, 江逸茗, 兰巨龙. 基于改进三元组网络和K近邻算法的入侵检测[J]. 计算机应用, 2021, 41(7): 1996-2002.
[2]	张全龙, 王怀彬. 基于膨胀卷积和门控循环单元组合的入侵检测模型[J]. 计算机应用, 2021, 41(5): 1372-1377.
[3]	唐延强, 李成海, 宋亚飞. 基于改进粒子群优化和极限学习机的网络安全态势预测[J]. 计算机应用, 2021, 41(3): 768-773.
[4]	杭梦鑫, 陈伟, 张仁杰. 基于改进的一维卷积神经网络的异常流量检测[J]. 计算机应用, 2021, 41(2): 433-440.
[5]	孙建军, 徐岩. 基于加权改进模糊C均值聚类的欠定混合矩阵估计[J]. 计算机应用, 2020, 40(6): 1769-1773.
[6]	黄永鑫, 唐雪飞. 基于近邻传播聚类和TANE算法的高校数据中函数依赖的发现[J]. 计算机应用, 2020, 40(1): 90-95.
[7]	池亚平, 莫崇维, 杨垠坦, 陈纯霞. 面向软件定义网络架构的入侵检测模型设计与实现[J]. 计算机应用, 2020, 40(1): 116-122.
[8]	王佳欣, 冯毅, 由睿. 基于依赖关系图和通用漏洞评分系统的网络安全度量[J]. 计算机应用, 2019, 39(6): 1719-1727.
[9]	毛伊敏, 刘银萍, 梁田, 毛丁慧. 基于模糊谱聚类的不确定蛋白质相互作用网络功能模块挖掘[J]. 计算机应用, 2019, 39(4): 1032-1040.
[10]	丁成, 王秋萍, 王晓峰. 基于广义反向学习的磷虾群算法及其在数据聚类中的应用[J]. 计算机应用, 2019, 39(2): 336-342.
[11]	杜俊雄, 陈伟, 李雪妍. 基于物联网设备指纹的情境认证方法[J]. 计算机应用, 2019, 39(2): 464-469.
[12]	刘晓明, 沈明玉, 侯整风. 基于Levy飞行的萤火虫模糊聚类算法[J]. 计算机应用, 2019, 39(11): 3257-3262.
[13]	叶双, 杨晓敏, 严斌宇. 基于自适应锚定邻域回归的图像超分辨率算法[J]. 计算机应用, 2019, 39(10): 3040-3045.
[14]	郭方方, 潮洛蒙, 朱建文. 基于相似连接的多源数据并行预处理方法[J]. 计算机应用, 2019, 39(1): 57-60.
[15]	邱保志, 程栾. 基于拉普拉斯中心性和密度峰值的无参数聚类算法[J]. 计算机应用, 2018, 38(9): 2511-2514.

基于相对Hamming距离的Web聚类算法

Web clustering algorithm based on relative hamming distance

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics