计算机应用 ›› 2015, Vol. 35 ›› Issue (5): 1255-1261.DOI: 10.11772/j.issn.1001-9081.2015.05.1255

• 先进计算 • 上一篇    下一篇

使用确定随机Petri网对Hadoop公平调度的建模和性能分析

何华1, 林闯2, 赵增华1, 庞善臣3   

  1. 1. 天津大学 计算机科学与技术学院, 天津 300072;
    2. 清华大学 计算机科学与技术系, 北京 100084;
    3. 中国石油大学 计算机与通信工程学院, 山东 青岛 266510
  • 收稿日期:2014-12-22 修回日期:2015-03-29 出版日期:2015-05-10 发布日期:2015-05-14
  • 通讯作者: 何华
  • 作者简介:何华(1982-),女,山东济宁人,博士研究生,主要研究方向:计算机网络、系统性能模型及评价、随机Petri网; 林闯(1948-),男,辽宁沈阳人,教授,博士生导师,博士,CCF会员,主要研究方向:计算机网络、系统性能模型及评价、随机Petri网、逻辑推演、推理系统;赵增华(1974-),女,河南南乐人,副教授,博士,CCF会员,主要研究方向:无线网状网络、无线多媒体传感器网络、物联网; 庞善臣(1974-),男,山东嘉祥人,教授,博士,CCF会员,主要研究方向:可信计算、服务计算、云计算、Petri网.
  • 基金资助:

    国家自然科学基金资助项目(610172063,61272093).

HE Hua1, LIN Chuang2, ZHAO Zenghua1, PANG Shanchen3   

  1. 1. School of Computer Science and Technology, Tianjin University, Tianjin 300072, China;
    2. Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China;
    3. College of Computer and Communication Engineering, China University of Petroleum, Qingdao Shandong 266510, China
  • Received:2014-12-22 Revised:2015-03-29 Online:2015-05-10 Published:2015-05-14

摘要:

由于Hadoop能在同一时间处理多个用户提交的不同作业的多个任务,这使得用传统的方法对其进行建模和性能分析变得十分困难.为了解决这个问题,基于马尔可夫排队模型M/MMDP/C/K建立了一个随机Petri网(SPN)模型和一个确定随机Petri网(DSPN)模型来分别描述Hadoop调度中的数据状态和作业公平调度.通过设置DSPN中的使动谓词和随机开关来建模Hadoop公平调度和YARN公平调度.使用嵌入的马尔可夫链模型来分析单用户情景,而在分析多用户情景时则引入分解和迭代技术来减小模型的状态空间,从而避免产生状态爆炸问题.研究侧重于Hadoop中作业调度的平均性能,仅通过求解提出的分析模型,就可以对比和分析服务质量(QoS)的一些关键指标,如平均吞吐量、平均队列长度和平均时延.采用Matlab进行仿真:当每秒到达任务数大于等于20时,YARN算法的数据积压和平均时延明显少于公平算法;当每秒到达任务数大于等于30时,YARN算法的平均吞吐量明显高于公平算法.实验结果表明,YARN公平算法能够减少平均处理和排队等待时间,在平均吞吐量、平均队列长度和平均时延上明显优于公平算法.

Key words: Hadoop, MapReduce, fair scheduling, Stochastic Petri Net (SPN), Deterministic and Stochastic Petri Net(DSPN), Quality of Service (QoS)

中图分类号: