%0 Journal Article %A 江小平 %A 李成华 %A 向文 %A 张新访 %T 云计算环境下朴素贝叶斯文本分类算法的实现 %D 2011 %R 10.3724/SP.J.1087.2011.02551 %J 计算机应用 %P 2551-2554 %V 31 %N 09 %X 采用分布式编程MapReduce模型研究了文本统一格式预处理、训练、测试以及分类等基于朴素贝叶斯文本分类算法主要计算过程的MapReduce并行化方法,并在Hadoop云计算平台进行了实验。实验结果表明:朴素贝叶斯文本分类算法MapReduce并行化后在Hadoop云计算平台上部署运行,具有较好的加速比,对中文网页文本分类识别率达到了86%。 %U http://www.joca.cn/CN/10.3724/SP.J.1087.2011.02551