fault tolerance中的错误和故障检测(Error and Fault Detection Mechanisms)
这里的介绍来自论文Survey of Error and Fault Detection Mechanisms:
下面这张图来自论文,反映了当今关于错误检测机制(Error Detection Mechanisms)的研究方向和分类:
ERROR:
error分为hard error(硬错误)和soft error(软错误)。hard error一般为制造和设计缺陷,而关于soft error,有两个来源:
1)高能粒子造成单粒子翻转(single event upset SEU),以及晶体管工作电压的减小降低了集成电路噪声容限从而使芯片更易受瞬态故障影响,我们称之为transient error(瞬态错误)。
2)制造和运行过程中的variations带来的temporal timing violations,我们称之为intermittent error(间歇性错误)。
其实,间歇性错误表现为瞬态错误的发生频率超过系统可靠性允许阈值范围。
内存中的检测机制:
由于我们的程序和OS常驻内存(包括L1 cache和L2 cache),因此内存出错是让程序和系统不可靠的重要原因,比如指令序列被破坏。常用的解决内存错误的机制是使用ECC(error checking and correcting,错误检查和纠正)码。
电路级(circuit-level)是如何应对上面两种错误(transient error 和 intermittent error):
在高辐射环境(high-radiation environments),有一种fault-tolerant电路叫hardened circuit(抗辐射集成电路),以及通过监测合闸电流和供电电压来判断是否有意外事件的电路监控技术(circuit monitoring),都是来检测和应对transient error的技术。
由variation引发的间歇性timing errors属于intermittent error,Tunable Replica Circuits、Razor Flip-Flops、Transition Detectors和Temporal Redundancy是解决它的方法。
另外,三模冗余TMR(Triple Modular Redundancy)也是从电路架构的角度发现错误的一种方法,输入信号由完全相同的三个模块分别独立处理,每个模块产生一个运行结果交给决策器,由决策器判断并输出结果,但缺点是只能发现单个模块错误且没有重构策略来修复错误模块。
以三模冗余为代表的技术属于fault tolerance常用的技术——冗余技术,是能检测并纠正错误和故障的有效方法。其实上面应用于内存中的ECC,以及常用的奇偶校验码Parity,属于冗余技术中的信息冗余,相比于硬件冗余的大开销,它仅需要少量额外的存储字节和计算开销或少量的额外编码电路即可。
fault tolerance中的错误和故障检测(Error and Fault Detection Mechanisms)相关推荐
- javascript中的错误处理机制
前面的话 错误处理对于web应用程序开发至关重要,不能提前预测到可能发生的错误,不能提前采取恢复策略,可能导致较差的用户体验.由于任何javascript错误都可能导致网页无法使用,因此作为开发人员, ...
- wps透视表列总计移到顶部_数据透视表总计中的错误
wps透视表列总计移到顶部 Pivot tables are a quick and easy way to summarize a table full of data, without fancy ...
- R语言ggplot2可视化在散点图中的每个点上绘制两个错误条:常见的是垂直错误条,它对应于Y值点上的错误(error bar),添加与X轴(水平)相关的错误条(error bar)
R语言ggplot2可视化在散点图中的每个点上绘制两个错误条:常见的是垂直错误条,它对应于Y值点上的错误(error bar),添加与X轴(水平)相关的错误条(error bar) 目录
- 已成功与服务器建立连接,但是在登录过程中发生错误。 (provider: SSL Provider, error: 0 - 接收到的消息异常,或格式不正确。)...
之前做好的asp.net部署后,发现 访问数据库时: 异常:已捕获: "已成功与服务器建立连接,但是在登录过程中发生错误. (provider: SSL Provider, error: 0 ...
- 已成功与服务器建立连接,但是在登录过程中发生错误。 (provider: SSL Provider, error: 0 - 接收到的消息异常,或格式不正确。)
已成功与服务器建立连接,但是在登录过程中发生错误. (provider: SSL Provider, error: 0 - 接收到的消息异常,或格式不正确.) 参考文章: (1)已成功与服务器建立连接 ...
- c++中调用python脚本提示 error LNK2001: 无法解析的外部符号 __imp_Py_Initialize等错误的解决方法
c++中调用python脚本提示 error LNK2001: 无法解析的外部符号 __imp_Py_Initialize等错误的解决方法 时间:2017-05-09 12:32:06阅读:234评论 ...
- 成功解决Python中导出图片出现错误SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position
成功解决Python中导出图片出现错误SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position ...
- mysql报错error2002_mysql中异常错误ERROR:2002的解决方法分享
最近在启动mysql的时候发现mysql报错了,错误代码是2002,通过查找相关的资料发现是var/lib/mysql 的访问权限问题,所以这篇文章主要介绍了mysql中异常错误ERROR:2002的 ...
- matlab中提示错误使用* BLAS loading error解决方法
matlab中提示错误使用* BLAS loading error解决方法 参考文章: (1)matlab中提示错误使用* BLAS loading error解决方法 (2)https://www. ...
最新文章
- python爬取豆瓣电影并分析_爬取豆瓣电影top250提取电影分类进行数据分析
- idea实用快捷键_idea万能快捷键,你不知道的17个实用技巧!!!
- 模板模式(部分方法延迟到子类实现)
- 在win server 2003上安装SQL Server 2008的步骤
- 怎么调整矩形边框宽度_PPT内容太少,怎么做才不会单调?
- 继Nat Friedman离开Github之后,Xamarin联合创始人离开微软
- 2020互联网岳麓峰会“软件再出发论坛”成功举办
- MongoDB(三):MongoDB概念解析
- Linux删除含有特殊符号文件名的文件
- 【你可能不知道的】 PICkit3 脱机烧写 program to go 模式
- python mkv转mp4,h264格式的flv和mkv无损转换成mp4的方法
- 消费者人群画像 python_2019数字中国创新大赛 消费者人群画像 信用智能评分
- get请求报404 NOT FOUND问题的原因及解决。
- 【教程】如何导入批量加海外号码到手机通讯录加whatsApp和line
- END-TO-END COMPLEX-VALUED MULTIDILATED CONVOLUTIONAL NEURALNETWORK FOR JOINT ACOUSTIC ECHO CANCELLA
- java init方法
- 分享数百个 HT 工业互联网 2D 3D 可视化应用案例
- HTML 绘制曲线图
- HTML首字下沉的编码,CSS_有关首行首字下沉的实现原理及代码,下面是两个个小技巧,一个是 - phpStudy...
- ruoyi自定义工作流(前端二,添加流程管理页面)