计算机应用 ›› 2013, Vol. 33 ›› Issue (12): 3432-3436.

• 2013年全国开放式分布与并行计算学术年会(DPCS2013)论文 • 上一篇    下一篇

基于一致性树分布的数据分布式存储方法

郭栋1,2,3,王伟1,2,3,曾国荪1,2,3   

  1. 1. 国家高性能计算机工程技术研究中心 同济大学分中心,上海 200092
    2. 同济大学 计算机科学与技术系,上海 200092;
    3. 国家高性能计算机工程技术研究中心 同济大学分中心,上海 200092
  • 收稿日期:2013-07-29 出版日期:2013-12-01 发布日期:2013-12-31
  • 通讯作者: 郭栋
  • 作者简介:郭栋(1991-),男,上海人,主要研究方向:分布式系统、云计算;
    王伟(1976-),男,上海人,副教授,博士,CCF会员,主要研究方向:并行计算、分布式系统;
    曾国荪(1964-),男,上海人,教授,博士生导师,CCF会员,主要研究方向:计算机软件、分布式系统、信息安全。
  • 基金资助:
    国家自然科学基金资助项目;上海市优秀学科带头人计划项目;教育部网络时代的科技论文快速共享专项研究课题资助项目;教育部博士点基金资助项目;浙江大学CAD&CG国家重点实验室开放课题资助项目;南京大学计算机软件新技术国家重点实验室开放课题资助项目;同济大学中央高校基本科研业务费专项资金资助项目;中国科学院模式识别国家重点实验室开放课题资助项目

Distributed data storage method based on consistent tree distribution

GUO Dong1,2,WANG Wei1,2,ZENG Guoshun1,2   

  1. 1. Department of Computer Science and Technology, Tongji University, Shanghai 200092, China
    2. Tongji Branch, National Engineering and Technology Center of High Performance, Shanghai 200092, China
  • Received:2013-07-29 Online:2013-12-31 Published:2013-12-01
  • Contact: GUO Dong

摘要: 随着云计算和大数据技术的发展,传统的单一存储介质的数据存储方式已经不能满足大数据处理的需求,在这样的背景下,分布式数据存储得到了广泛的应用。然而,目前存在的几种分布式存储方式并不能够完美地满足分布系统的需求。为了更有效地实现数据的分布式存储和冗余备份,采用一种新的基于一致性树分布(CTD)的分布式存储方法,并提出基于该方法的备份策略,实现数据索引与存储位置的映射。该方案具有负载平衡、无单点故障问题、扩展性高且易于实现的优点。同时提出了基于一致性二叉树分布(CBTD)的应用方案。通过对应用系统实例的分析,验证该方法能够很好地满足分布式系统的数据平衡、负载均衡和扩展性需求。

关键词: 分布式系统, 分布式存储, 一致性树分布, 一致性二叉树分布

Abstract: With the development of cloud computing and big data, traditional single storage medium based data storage cannot meet the demands of large data processing, thus distributed data storage has been widely used recently. However, some existing distributed ways of storage cannot perfectly meet the needs of the distribution system. In order to achieve the distributed data storage and redundancy more effectively, a new distributed method and backup strategy based on Consistent Tree Distribution (CTD) was proposed to achieve the location mapping of data indexing and storage. The new method featured load balancing, no single point of failure, high scalability and easy programming. In addition, a method based on Consistent Binary Tree Distribution (CBTD) was also put forward. Analysis of the application system verifies that the method can satisfy the data balance, load balance and high scalability requirements of the distributed system.

Key words: distributed system, distributed storage, Consistent Tree Distribution (CTD), Consistent Binary Tree Distribution (CBTD)

中图分类号: