摘要: 随着计算机技术的发展,计算机系统的可靠性越来越受到人们的重视,而容错技术是提高可靠性的一种有效方法。本文研究了计算机容错技术的各种方法,如硬件容错、信息容错、软件容错等,介绍了TMR(三模冗余)的原理及其缺点,详细研究了两种最基本的软件容错技术NVP和RB。这些容错技术可有效提高计算机系统的可靠性。本文引用地址:http://www.eepw.com.cn/article/202502.htm

计算机的应用十分广泛,航空航天、军事、银行监管系统、交通运输系统以及其他重要的工业领域对计算机的可靠性要求非常高。计算机系统出现故障不仅会导致国家财产的严重损失,还会危及人身安全。因此,在这些领域中计算机的可靠性越来越受到人们的重视,国家非常重视可靠性的研究工作,投入了大量的资源。

1 基本容错技术

一般而言,提高计算机的可靠性有两种比较有效的方法。一种是避错,就是避免出现故障,这就需要严格筛选计算机元器件,完善设计,提高制造工艺,以及加强质量管理等。但即使是这样一个计算机系统,由于其所在的工作环境有各种环境应力,如湿度、温度、电磁干扰、强震动等,因此总避免不了出现故障。这就要求在计算机出现故障的情况下容忍故障的存在,即第二种方法--容错技术。容错技术最早由约翰·冯·诺依曼(John VON Neumann)提出,所谓容错是指在出现一个或者几个硬件或软件方面的故障或错误的情况下,计算机系统能够检测出故障的存在并采取措施容忍故障,不影响正常工作,或者在能够完成规定的任务的情况下降级运行[1]。

故障是指由于部件的物理失效、环境应力的作用、操作错误或不正确的设计,引起系统的硬件或软件的错误状态[2]。下面介绍几种相关技术的基本概念。

故障检错技术:对于计算机系统的容错首先要用到故障检错技术,即在计算机系统发生故障的情况下能够检测出故障的存在。

故障诊断技术: 检测出系统存在故障后要进行故障的定位,找出故障所在的位置。

故障恢复技术: 在检测出故障和定位故障的所在位置之后,就要运用故障恢复技术把系统从故障的状态恢复到无故障的状态继续运行。

容错最基本的的方法是冗余技术,所谓冗余就是超过系统实现正常功能的额外资源。冗余包括硬件冗余、软件冗余、时间冗余和信息冗余。

1.1 硬件容错技术

硬件冗余又包括静态硬件冗余(也叫被动硬件冗余)、动态硬件冗余(也叫主动硬件冗余)和混合冗余(静态冗余和动态冗余的结合)。静态硬件冗余常见的形式有三模冗余(TMR),其基本原理是:系统输入通过3个功能相同的模块,产生的3个结果送到多数表决器进行表决,即三中取二的原则,如果模块中有一个出错,而另外两个模块正常,则表决器的输出正确,从而可以屏蔽一个故障,TMR的缺点是,如果3个模块的输出各不相同,则无法进行多数表决;若有两个模块出现一致的故障,则表决的结果会出现错误。TMR结构如图1所示。

图1 TMR结构图

三模冗余可推广到N模冗余(NMR),其基本原理与TMR的原理相同,其中N≥3,且N为奇数,以便进行多数表决。动态冗余是指当检测到工作的模块出现错误时,就切换到一个备用的模块,当换上的备用模块又发生故障时,再切换到另一个备用模块,依次类推,直到备用的模块用完。

1.2 时间容错技术

时间容错的基本思想是:重复执行指令或者一段程序来消除故障的影响,以达到容错的效果,它是用消耗时间来换取容错的目的。根据执行的是一条指令还是一段程序,分成两种方法:

一种是指令复执。当检测出故障的时候,重复执行故障指令,若故障是瞬时的,则在指令复执期间可能不会出现,程序就可以继续向前运行。指令复执必须保留上一指令结束的“现场”,包括累加器、PC及其他状态寄存器的状态。

另一种是程序卷回。它不是重复执行一条指令,而是重复执行一小段程序。在整段程序中可以设置多个恢复点,程序有错误的情况下可以从一个个恢复点处开始重复执行程序。首先检验一小段程序的计算结果,若结果出现错误则卷回再重复执行那个部分,若一次卷回不能解决,可以多次卷回,直到故障消除。

计算机网络系统容错检测,计算机系统的容错技术方法相关推荐

  1. 建筑智能信息网络系统计算机网络系统检检测指导书,04智能建筑检验批划分作业指导书.doc...

    附件4:<智能建筑分部工程检验批划分指导意见> 智能建筑分部工程检验批划分指导意见 分部工程名称 子分部 工 程 名 称 分项工程 检验批表名称 划分说明 (供参考) 报验附件资料 名称( ...

  2. 计算机网络系统自检测记录,SG-A122智能建筑计算机网络系统检测分项工程质量验收记录表.doc...

    <SG-A122智能建筑计算机网络系统检测分项工程质量验收记录表.doc>由会员分享,可在线阅读,更多相关<SG-A122智能建筑计算机网络系统检测分项工程质量验收记录表.doc(6 ...

  3. 计算机 电压保护水平,计算机系统的过电压保护技术及应用

    计算机应用 文章编号:1009 3664(2006)04 0053 03设计应用 计算机系统的过电压保护技术及应用 尹洪胜1,邓 威1,华 钢1,张 毅2,陈金保2,朱小明2 (1.中国矿业大学信电学 ...

  4. 怎样判断计算机硬盘损坏,检测硬盘是否损坏的方法来了,这里有四种判断方法!...

    原标题:检测硬盘是否损坏的方法来了,这里有四种判断方法! 大家对硬盘都不陌生,硬盘分固态硬盘与机械硬盘,它们的读取速度与容量都有很大的区别,不过都是可以用来存储系统与重要文件数据的.硬盘损坏是电脑的硬 ...

  5. 思科配置计算机ip地址子网掩码,计算机系统与网络技术IP地址 子网掩码 主机号等计算复习...

    IP地址 子网掩码 主机号等计算复习 IP地址.子网掩码.网络号.主机号.网络地址.主机地址复习 IP地址:4段十进制,共32位二进制,如:192.168.1.1 二进制就是:11000000|101 ...

  6. 计算机硬件故障智能检测软件,电脑硬件故障检测方法和检测工具推荐

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 一部完整的计算机是由硬件和软件组成的,如果硬件出问题的话,我们如何确定是哪一个硬件出问题呢? 小提示: 如果你购买的笔记本或者台式机仍在保修期内,就不需要 ...

  7. 检测计算机命令,磁盘检测命令chkdsk的使用方法

    经常看到有很多朋友在系统开机的时候因系统自检程序时间过长而往往直接跳过磁盘检测,而直接跳过这种心急的想法有时候会引来大祸患.今天我们介绍的chkdsk命令是系统自带的系统修复命令,可以帮助我们解决很多 ...

  8. 计算机网络系统互联,关于计算机网络系统的开放性结构与网络互联

    计算机网络系统的开放性和开放性网络结构问题一直是影响计算机网络系统发展甚至影响具体网络系统生命力的一个重要问题. 网络系统的许多重要概念和特性,如互联性.互通性.互操作性.可移植性.可扩性.标准化.统 ...

  9. 检验专业考计算机吗,2017职称计算机考试Dreamever检测试题

    2017职称计算机考试Dreamever检测试题 全国专业技术人员计算机应用能力考试是专业技术人员资格考试的一种.下面是应届毕业生小编为大家搜索整理的2017职称计算机考试Dreamever检测试题, ...

最新文章

  1. JS-排序详解:冒泡排序、选择排序和快速排序
  2. makefile例子《一》
  3. Spring Cloud入门教程(二):客户端负载均衡(Ribbon)
  4. container_of详解
  5. 静态注册fragment_Fragment的静态和动态添加方式以及Fragment和Activity之间的通信方式...
  6. mysql连接被拒绝 密码也对_解决Mysql数据库拒绝远程连接和忘记密码的问题
  7. leetcode 20. 有效的括号 (python)
  8. Eclipse主题设置方法(系统主题设置、自行下载主题设置)
  9. 《System语言详解》——5. 语言元素
  10. 需求调研第三篇--现场调研阶段容易犯哪些错误
  11. php添加商品和显示商品的业务逻辑
  12. 武汉大学研究生慕课《学术道德与学术规范》——考试题目总结
  13. python scapy2.3 在windows上的安装
  14. Matplotlib下plt常用指令总结
  15. 基于WENET制作AI字幕
  16. Unity内存管理的原理
  17. 高等数学-《函数与极限》总结笔记
  18. Android 卡顿验证方法1:系统跟踪 Perfetto
  19. RFID射频识别卡(以下称射频卡)的分类
  20. MD5、SHA1、CRC32值是干什么的?(转载)

热门文章

  1. 8后淡入淡出没有了_8·30广州岑村ufo事件,人为制作的造假视频
  2. js map 排序_数组方法写给女友的一系列 JS 数组操作(建议收藏 | 内附思维导图)...
  3. mysql command line client 目标不对_简单几招提高MySQL安全性
  4. 聊聊“数据安全与数据治理”那些事
  5. 大型企业多账号管理“安全心法”
  6. 【2021云边协同大会】阿里云周哲畅聊边缘云基础设施创新发展及场景化实践
  7. 基于财通证券的数字化建设,总结的金融行业数字化转型方向
  8. Flink Forward Asia 2020 - Keynote 总结
  9. 拆!对比详解 Flutter Widget 和 CSS,你关心的布局原理都在这儿了
  10. 技术分享 |《原神》部分渲染效果分析