通信世界网消息(CWW)随着云化转型的深入,在网运行服务器数量在不断增加,服务器死机和重启成为运维中难以避免的现象。有没有一种功能或者工具能够记录死机、重启前一刻发生了什么,并能够分析服务器各种异常参数?这里不得不提一种叫“黑匣子”的技术。

“黑匣子”是电子飞行记录仪的俗称,用于记录飞机飞行和性能参数的仪器。飞行记录仪记录的信息可用于飞行事故分析,人们可根据飞机坠毁前记录的数据和话音记录,经处理后送入一种飞行模拟器,重现事故的过程,形象地分析事故原因。

服务器上有一个独立的BMC系统(BaseboardManagement Controller),通俗来讲,BMC是整个服务器单板的大管家,从服务器上电那一刻,它所有部件均由BMC来负责和管理。BMC主要用于对服务器各个部件(CPU、内存、硬盘、风扇、机框等)的温度、电压等健康状态进行检测,同时根据各个温度采集点情况实时调整风扇转速避免服务器产生过温、总体功耗过高的情况发生。如果单板部件出现任何异常则通过SNMP协议、SMTP协议、Redfish协议等多种业界通用规范将信息及时上报给上层网管,以便运维人员及时处理,保障业务无损。BMC主要用于采集单个服务器上的信息,同时将信息提供给上层运维网管软件,一般情况下BMC软件上报的消息中会指明哪个部件产生故障以及处理建议等。

服务器的“黑匣子”功能是BMC系统不可或缺的一部分,它起到了与飞机“黑匣子”同样的作用。系统正常运作时,“黑匣子”记录着系统的各种运行参数;当BMC检测到致命故障或者系统异常状态,“黑匣子”将记录下发生故障时的系统状态。故障分析人员通过“黑匣子”中记录的数据,可快速定位故障发生的那一刻,并分析异常产生的根本原因。虽然通过系统的崩溃日志等其他手段也可以进行故障分析和定位,但是均比“黑匣子”功能费时费力,“黑匣子”可简单而直接的记录底层硬件数据,可更加快速地解决硬件故障引发的系统问题。

市面上的“黑匣子”功能有带内管理和带外管理两种方式,带外管理(out-of-band)是基于硬件的一种管理方式,使用专用硬件模块或特殊的远程管理卡提供管理接口,通过专用的数据通道对设备进行远程维护和管理,完全独立于设备操作系统之外,甚至可以在设备关机状态下进行远程监测与管理。带内管理(in-band)需要在OS层安装原厂或者第三方驱动,对于客户数据敏感的应用,如果通过带内管理需要对OS层的驱动进行全方位测试和验证,以防止驱动程序的漏洞被利用,造成数据泄露。

中兴通讯全系列服务器产品均搭载“黑匣子”功能,并提供一键故障解析工具,可在系统出错的第一时间分析故障根本原因,对于可纠正级的轻微错误,比如CPU QPI总线CRC错误,PCIE总线错误,根据大量的外场故障数据进行分析,总结规律阈值,事前通知用户,可以有效地提前预判故障。同时,中兴通讯的“黑匣子”功能和一键解析工具均通过带外方式进行数据采集,可有效避免用户数据泄露的风险。

未来,中兴通讯将秉持开放合作的理念,坚持自主创新之路,以核心技术为基石,突破传统生态,持续推动服务器产品生态的繁荣发展。

中兴通讯能制造服务器吗,中兴通讯服务器搭载“黑匣子”功能,让故障无处遁形...相关推荐

  1. 中兴通讯能制造服务器吗,中兴通讯发布边缘计算服务器 实现边缘人工智能

    2019年世界移动大会期间,中兴通讯发布了ES600S MEC服务器,该款服务器搭载英特尔? 至强? Scalable processor,配合AI加速卡,使其在边缘侧具备很强的神经网络推理能力. 随 ...

  2. 华为云服务器芯片,云服务器芯片

    云服务器芯片 内容精选 换一换 华为云帮助中心,为用户提供产品简介.价格说明.购买指南.用户指南.API参考.最佳实践.常见问题.视频帮助等技术文档,帮助您快速上手使用华为云服务. 本文介绍了弹性云服 ...

  3. 虚拟化服务器类型,虚拟化服务器类型

    虚拟化服务器类型 内容精选 换一换 本次Ceph集群使用TaiShan服务器部署,三个Ceph节点采用三台为TaiShan 200服务器(型号2280):K8s节点两台均采用TaiShan 200服务 ...

  4. 华为的服务器虚拟化软件,服务器虚拟化软件

    服务器虚拟化软件 内容精选 换一换 为了解决Windows系统的源端服务器与目的端弹性云服务器的兼容性问题,您需要手动给目的端服务器安装相关驱动进行优化.登录管理控制台.选择"计算 > ...

  5. 正确使用GPU服务器gpu服务器和普通服务器的不同之处

    前言 其实现在很多人都听说或者接触过服务器,众所周知,服务器是网络中的重要设备,要接受少至几十人.多至成千上万人的访问,因此对服务器具有大数据量的快速吞吐.超强的稳定性.长时间运行等严格要求.但是今天 ...

  6. x86服务器与arm服务器

    服务器是提供计算服务的设备,服务器的构成包括处理器.硬盘.内存.系统总线等,和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力.稳定性.可靠性.安全性.可扩展性.可管理性等方面要求较 ...

  7. 八百元八核的服务器?二手服务器(工作站)搭建指南(下)

    本文分成两部分,上一部分传送门:<八百元八核的服务器?二手服务器搭建指南> 在上一部分我们已经学习了搭建二手服务器的基础知识,这部分,我们将深入学习各种配件的详细参数.选择适合的配置.学习 ...

  8. 物理服务器、云服务器、虚拟主机的区别是什么

    物理服务器.云服务器.虚拟主机的区别是什么 我们做网站建设的基本上都会碰到一个问题,就是空间服务器的.那么这个有什么好纠结的呢,服务器又是什么呢?我们引用一下网上的话 服务器指一个管理资源并为用户提供 ...

  9. 香港云服务器比香港服务器更快吗?

    自云服务器崛起以来,与物理服务器比较的争论就没有间断.许多朋友问,香港云服务器比香港服务器更快吗?恒创科技对此简单解答. "更快",暂且理解为网站或应用程序的响应.加载速度以及网络 ...

最新文章

  1. Fatal error in launcher: Unable to create process using ‘“d:\python3.6\python.exe“ “D:\python3.6\Sc
  2. .Net Core应用框架Util介绍(四)
  3. 2016OSC源创会年终盛典-综合技术专场-张小刚
  4. mysql用户阻塞数_MySQL实例阻塞分析一例(线程statistics状态)
  5. jsp登录密码加密_[源码和文档分享]基于JSP和MYSQL数据库的在线购物网站的设计与实现...
  6. CSS 浮动 float属性
  7. 【数据库】第一章 数据库的分类、SQL、数据库、表和表记录的常用操作
  8. select 实现类似多线程_redis中的网络IO有了解过吗,它是单线程的还是多线程的,为什么要用单线程?...
  9. CALLBACKS IN C++ USING TEMPLATE FUNCTORS
  10. asp.net控件开发技巧(2)关闭基类不必要的功能
  11. Markdown(六)——表格合并单元格增加标题
  12. 54. Cache-Control
  13. UEditor的使用方法
  14. 2022年web前端面试题
  15. html的存储路径在哪,x浏览器书签保存在哪里?x浏览器书签本地存储路径位置分享...
  16. python爬虫登录微博账号_python模拟登录新浪微博 python新浪微博爬虫
  17. 第六讲 复数和复指数
  18. (比较器)Comparator比较器
  19. 清除dns缓存cmd命令行方式
  20. 微卡认证系统使用手册

热门文章

  1. 【CS231n】十五、深度学习的高效算法和硬件设计
  2. 动手实现一个docker引擎-1-从内核到docker的三驾马车
  3. /boot空间不足的解决办法
  4. 办公软件——隐私条款
  5. 手机取证技巧之微信迁移取证_数字取证技巧和窍门:«您的电话»应用取证
  6. Android运行ListView的代码,Android ListView组件详解及示例代码
  7. Android——进程间通信方式
  8. linux 内存各指标,Linux 内存性能指标
  9. Linux学习之----socket网络编程基础
  10. 阿里面试,问了我乐观锁、悲观锁、AQS、sync和Lock,这个回答让我拿了offer