计算机应用 ›› 2013, Vol. 33 ›› Issue (12): 3339-3344.

• 2013年全国开放式分布与并行计算学术年会(DPCS2013)论文 • 上一篇    下一篇

基于Hadoop的大矩阵乘法处理方法

孙远帅1,陈垚1,官新均1,林琛1,2   

  1. 1. 厦门大学 信息科学与技术学院,福建 厦门 361005;
    2. 厦门大学 深圳研究院,广东 深圳 518000
  • 收稿日期:2013-07-11 出版日期:2013-12-01 发布日期:2013-12-31
  • 通讯作者: 林琛
  • 作者简介:孙远帅(1989-),男,河南濮阳人,硕士研究生,主要研究方向: Web数据挖掘、矩阵分解算法、大规模数据处理;
    陈垚(1992-), 男,安徽宣城人,主要研究方向:生物信息学;
    官新均(1992-),男,广东深圳人,主要研究方向:实体匹配;
    林琛(1982-),女,福建厦门人,助理教授,博士,CCF会员,主要研究方向:Web数据检索、数据挖掘和管理。
  • 基金资助:
    国家自然科学基金资助项目;国家自然科学基金资助项目;深圳市战略性新兴产业发展专项资金资助项目

Approach of large matrix multiplication based on Hadoop

SHUN Yuanshuai1,CHEN Yao1,GUAN Xinjun1,LIN Chen1,2   

  1. 1. School of Information Science and Engineering, Xiamen University, Xiamen Fujian 361005, China
    2. Shenzhen Research Institute of Xiamen University, Shenzhen Guangdong 518000, China
  • Received:2013-07-11 Online:2013-12-31 Published:2013-12-01
  • Contact: LIN Chen
  • Supported by:
    National Natural Science Foundation;National Natural Science Foundation

摘要: 目前的矩阵乘法算法无法处理大规模和超大规模的矩阵,而随着MapReduce编程框架的提出,并行处理矩阵乘法成为解决大矩阵运算的主要手段。总结了矩阵乘法在MapReduce编程模型上的并行实现方法,并提出了实现高性能大矩阵乘法的策略——折中单个工作节点的计算量和需要网络传输的数据量。实验证明,并行实现算法在大矩阵上明显优于传统的单机算法,而且随着集群中节点数目的增多,并行算法会表现出更好的性能。

关键词: 大矩阵, 矩阵乘法, 矩阵运算, MapReduce, Hadoop, 并行计算, 海量数据

Abstract: Large and very large matrix cannot be dealt by current matrix multiplication algorithms. With the development of MapReduce programming frame, parallel programs have become the main approaches for matrix computing. The matrix multiplication algorithms based on MapReduce were summarized, and an improved strategy for large matrix was proposed, which had a tradeoff in the data volume between the computation on single work node and the network transmission. The experimental results prove that the parallel algorithms outperform the traditional ones on the large matrix, and the performance will improve with the increase of the clusters.

Key words: large matrix, matrix multiplication, matrix computation, MapReduce, Hadoop, concurrent computation, massive data

中图分类号: