%0 Journal Article %A 蔡皖东 %A 丁要军 %T 基于互信息选择聚类集成的网络流量分类方法 %D 2013 %R 10.3724/SP.J.1087.2013.00080 %J 计算机应用 %P 80-82 %V 33 %N 01 %X 针对互联网流量标注困难以及单个聚类器的泛化能力较弱,提出一种基于互信息(MI)理论的选择聚类集成方法,以提高流量分类的精度。首先计算不同初始簇个数K的K均值聚类结果与训练集中流量协议的真实分布之间的规范化互信息(NMI);然后基于NMI的值来选择用于聚类集成的K均值基聚类器的K值序列;最后采用二次互信息(QMI)的一致函数生成一致聚类结果,并使用一种半监督方法对聚类簇进行标注。通过实验比较了聚类集成方法与单个聚类算法在4个不同测试集上总体分类精度。实验结果表明,聚类集成方法的流量分类总体精度能达到90%。所提方法将聚类集成模型应用到网络流量分类中,提高了流量分类的精度和在不同数据集上的分类稳定性。 %U http://www.joca.cn/CN/10.3724/SP.J.1087.2013.00080