计算机应用 ›› 2012, Vol. 32 ›› Issue (08): 2150-2158.DOI: 10.3724/SP.J.1087.2012.02150
李晓恺1,2,代翔1,2,李文杰1,2,崔喆1
LI Xiao-kai1,2,DAI Xiang1,2,LI Wen-jie1,2,CUI Zhe1
摘要: 为了让Hadoop分布式文件系统(HDFS)达到更高的存储效率以及更加优化的负载均衡能力,针对HDFS的多副本存储技术提出了改进方案——Noah。Noah引入了编码和译码模块,对HDFS中的block进行编码分解,生成更多数量的数据分片(section),并随机地分散保存到集群当中,替代原有系统的多副本容灾策略;在集群出现节点失效的情况下,通过收集与失效block相关的任意70%左右的section进行原始数据的恢复;同时根据分布式集群运行情况以及对副本数目需求的不同采用动态副本策略。通过相关的集群实验,表明Noah在容灾效率、负载均衡、存储成本以及安全性上对HDFS作了相应的优化。
中图分类号: