计算机应用 ›› 2013, Vol. 33 ›› Issue (12): 3368-3371.
• 2013年全国开放式分布与并行计算学术年会(DPCS2013)论文 • 上一篇 下一篇
XU Yabin1,2,LI Zhuo1,2,CHEN Junyi2
摘要: 互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。
中图分类号: