%0 Journal Article %A 程小辉 %A 陆秋 %T 基于MapReduce的决策树算法并行化 %D 2012 %R 10.3724/SP.J.1087.2012.02463 %J 计算机应用 %P 2463-2465 %V 32 %N 09 %X 针对传统决策树算法不能解决海量数据挖掘以及ID3算法的多值偏向问题,设计和实现了一种基于MapReduce架构的并行决策树分类算法。该算法采用属性相似度作为测试属性的选择标准来避免ID3算法的多值偏向问题,采用MapReduce模型来解决海量数据挖掘问题。在用普通PC搭建的Hadoop集群的实验结果表明:基于MapReduce的决策树算法可以处理大规模数据的分类问题,具有较好的可扩展性,在保证分类正确率的情况下能获得接近线性的加速比。 %U http://www.joca.cn/CN/10.3724/SP.J.1087.2012.02463