计算机应用 ›› 2014, Vol. 34 ›› Issue (1): 41-45.DOI: 10.11772/j.issn.1001-9081.2014.01.0041

• 先进计算 • 上一篇    下一篇

利用冗余核的MPSoC故障检测方法

唐柳1,2,3,黄樟钦2,侯义斌2,方凤才1,3,张会兵4   

  1. 1. 广西师范学院 物理与电子工程学院,南宁 530023;
    2. 北京工业大学 计算机学院,北京 100124;
    3. 广西师范学院 物理与电子工程学院,南宁 530023;
    4. 广西可信软件重点实验室(桂林电子科技大学),广西 桂林 541004
  • 收稿日期:2013-07-15 修回日期:2013-09-04 出版日期:2014-01-01 发布日期:2014-02-14
  • 通讯作者: 唐柳
  • 作者简介:唐柳(1977-),女(瑶族),广西大化人,讲师,博士研究生,主要研究方向:微处理器系统可靠性;黄樟钦(1965-),男,浙江绍兴人,教授,博士,主要研究方向:嵌入式软硬件协同设计、人机交互;侯义斌(1953-),男,陕西武功人,教授,博士,主要研究方向:嵌入式软件与系统、人机交互;方凤才(1973-),男,广西南宁人,讲师,主要研究方向:电路设计、电子产品;张会兵(1976-),男,河南南阳人,讲师,博士,主要研究方向:可信计算、物联网。
  • 基金资助:

    国家自然科学基金资助项目;认知无线电与信息处理(省部共建)教育部重点实验室开放课题;广西自然科学基金资助项目;广西可信软件重点实验室项目;广西教育厅高校科研项目

Fault detection approach for MPSoC by redundancy core

TANG Liu1,2,HUANG Zhangqin1,HOU Yibin1,FANG Fengcai2,ZHANG Huibing3   

  1. 1. School of Computer Science, Beijing University of Technology, Beijing 100124, China;
    2. School of Physics and Electronic Engineering, Guangxi Teachers Education University, Nanning Guangxi 530023, China;
    3. Guangxi Key Laboratory of Trusted Software (Guilin University of Electronic Technology), Guilin Guangxi 541004,China
  • Received:2013-07-15 Revised:2013-09-04 Online:2014-01-01 Published:2014-02-14
  • Contact: TANG Liu

摘要: 在处理器可靠性研究中,为在容错机制部署与容错开销之间达到较好的平衡,提出一个利用冗余核进行检测代码计算任务的多处理器片上系统(MPSoC)故障检测方法。该方法利用多核系统天然的冗余特性,将用于进行故障检测的冗余代码中的大部分计算任务转移到冗余核中进行,检测软件控制流的正确性和数据的一致性,实现MPSoC的故障检测。所提方法无需添加额外硬件,通过指令级的冗余进行故障检测,可满足系统可靠性需求,同时又能减少面积开销,在性能方面和花销上做到有效的权衡。在一个MPSoC上对所提方法进行验证实验,通过故障注入,运行多个基准程序进行有效性验证,并将所提方法与几种具有代表性的软件检测硬件故障方法故障检测能力、面积、内存以及性能花销等方面进行比较,实验结果证明所提方法有效且能够在性能和花销之间取得较好的权衡。

关键词: 多处理器片上系统, 可靠性, 故障检测, 冗余核, 检测代码

Abstract: For a better trade-off between fault-tolerance mechanism and fault-tolerance overhead in processor reliability research, a fault detection approach for Multi-Processor System-on-Chip (MPSoC) that placed the calculation task of detecting code on redundancy core was proposed in this paper. The approach achieved MPSoC failure detection by placing the calculation and comparison parts of detecting code on redundancy core. The technique required no additional hardware modification, and shortened the design cycle while reducing performance and memory overheads. The verification experiment was implemented on a MPSoC by fault injection and running multiple benchmark programs. Comparing several previous methods of fault detection in terms of capability, area, memory and performance overhead, the experiment results show that the approach is effective and able to achieve a better trade-off between performance and overhead.

Key words: Multi-Processor System-on-Chip (MPSoC), dependability, fault detection, redundancy core, detecting code

中图分类号: