凌云时刻

编者按:作者为阿里云日志服务团队的丁来强,花名成喆,一直从事云原生可观测平台、安全运营平台的产品与技术研发,本文根据作者在2021阿里云开发者大会的分享整理而成。

人体的8种感觉

我们都知道人体神经系统非常复杂,由各个末梢信号后经由脊髓、大脑中枢处理后获得如下众所周知的5种感觉:视觉——眼睛、听觉——耳朵、触觉——皮肤、嗅觉——鼻、味觉——口。除此之外,人体其实还有另外3种重要的感觉,分别是:内脏觉——内脏、本体觉——关节肌肉、前庭觉——前庭神经核

其中,内脏觉获取来内脏壁信号,产生内脏相关的感觉例如饥饿、饱腹、尿急等。本体觉获取关节肌肉等信号,感知当前身体处于一个什么样的姿势和运动状态。前庭觉则通过各方信号,获得平衡方向感,并过滤信号以便集中精神。

不用说,任何一个感觉出了问题,都会造成非常严重的后果。人们健康快乐的生活离不开这些神经系统的正常工作。

企业IT系统的感觉系统

企业IT系统同样存在各种感觉——对计算、网络、存储、安全、管控等系统的监控运维。数字化信息化的今天,企业组织能否健康、稳定、持续的发展也离不开其IT系统的神经系统——监控运维系统(更宽泛的说法叫可观测性系统)的正常工作。

但不同于人类物种经过几百万年的统一演化保持了基本一致性,企业IT系统的告警监控系统(可观测性系统),还存在非常大的多样性,例如:使用开源方式对容器化部署形态IT系统的监控就存在多种方案:

传统告警系统大量碎片化、无体系的神经孤岛,带来了非常多的痛点,包括重复建设、监控智能差、告警风暴、触发不人性化、无法闭环等。

SLS告警为企业IT系统提供智能神经中枢

作为新一代的云原生可观测平台,SLS支持多种数据源的一体化接入、一站式的存储、加工、分析、可视化、监控、投递、三方对接,为企业IT系统的使用者(包括开发运维、监控人员、商务、安全运营人员等)提供了最快、最高效的观测体验。

作为SLS的一个子系统,SLS告警为IT系统重现构建了智能神经中枢。目前,已经被阿里云平台的企业用户大量使用,每天从海量的数据中监控识别产生告警、管理处理并通知与响应,可证明的灵活适配与稳定可靠性。

使用SLS告警可以给企业IT系统的神经中枢提升易用弹性、可靠性以及功能灵活性,并降低成本、告警噪音以及减少损失。

下面,我们从几个侧面了解一下SLS告警是如何为企业IT系统提供智能的神经中枢的:

 接入三方告警——兼听则明

类似于人体的多种感觉从多方获取信号设置告警(例如听到天气预报说明天会下大雨而出门带好雨伞),SLS告警也支持从其他多种流行监控系统中直接接受告警,并进行智能处理与响应。支持的三方系统包括Promethues告警、Grafana告警、Zabbix告警等。

 统一信号分析——智能告警监控

SLS作为可观测平台,已经接收了IT系统的大量信号(日志、时序、跟踪等),可以直接使用SLS告警从中挖掘出大量信息(告警),SLS提供了一套查询分析语法,全面覆盖现在流行的时序、分析型语法,兼顾强大灵活与易上手。

不仅如此,还支持多种数据的协同关联,就像闭上眼睛,拿一个水果,也可以通过触觉、嗅觉、听觉等判断出这是一个杯子、还是一个苹果等。

 智慧信号处理——ML算法

就像人的脊髓、大脑等会自动参与信号处理得到更高级的感觉信息一样,从海量的数据中产生信息包括告警,离不开机器学习的支持,SLS提供多种丰富流行与顶级算法,更精准高效的产生告警。

 千里眼——全局监控

人的感觉系统是有距离限制的,触觉限制了手能够到的地方,视觉可达数公里。但IT企业系统可能分布在各个国家、城市系统或各个隔离的账号体系中,SLS告警支持跨库、跨地域、跨账号的对数据进行远程监控,就像千里眼一样。

 知识库——内置规则库

人类善于学习积累来扩展感觉系统,一个小朋友在摸过看过或碰触装了热水的玻璃杯后会记住这个感觉,下次再看到冒着热水的玻璃杯就会得到一样的信息。SLS告警的内置告警规则库,提供数百个这样的知识,开箱即用。

 告警降噪——IT系统的前庭觉

一个游戏迷在玩《王者荣耀》或一个新青年在看《光荣与梦想》时,通常会自动忽略周围的大部分信息,这其实是前庭觉在起作用。

在企业监控告警中,也需要通用的机制:在收到一个主机宕机的严重告警时,IT运维同学加紧迁移系统中,希望自动忽略该主机上一连串的其他告警的。亦或者在晚上休息期间,非严重告警,要被自动忽略掉。

SLS告警的管理功能(告警策略、行动策略等),可以提供静默、合并、合并降噪等功能,也支持根据节假日、工作时段等灵活调整通知策略等。

 告警态势大盘——IT系统的本体觉

类似于本体觉让你闭上眼睛也能感知自己是站着还是躺着,处于什么姿势一样。SLS告警的多张告警大盘让使用者轻松掌握目前整体告警态势与进展。

 记事本——事务管理

人的神经系统不能一下次并行处理多个事务(例如很难一边写作业、一边玩游戏),也不容易记住很多事情。IT系统运维人员面对许多并行告警时,同样如此,SLS的告警事务管理提供了这样的便利,就像记事本一样帮助他们管理好各个告警的状态,及时有效的跟进或处理。

 神经系统响应——行动管理

一如人体对于感觉会做出反应(如看到危险,要躲避一样),SLS告警提供多种通知与响应形式,包括各种渠道:

企业组织下还支持贴心的功能如:值班表(轮岗代班等)、告警升级等。

你可能还想看

1. 工作7年,我的10条经验总结

2. OAM 与 KubeVela 项目整体捐赠进入 CNCF,让云端应用交付更加简单

3. 龙蜥社区首届理事大会圆满召开!14家理事代表出席

4. 仅用 480 块 GPU 跑出万亿参数,中文最大规模多模态预训练模型发布

5. CPU静默数据错误:存储系统数据不丢不错的设计思考

END

关注「凌云时刻」

每日收获前沿技术与科技洞见

智能告警——企业IT系统神经中枢相关推荐

  1. 可观测告警运维系统调研——SLS告警与多款方案对比

    简介: 本文介绍对比多款告警监控运维平台方案,覆盖阿里云SLS.Azure.AWS.自建系统(ELK.Prometheus.TICK)等方案. 前言 本篇是SLS新版告警系列宣传与培训的第三篇,后续我 ...

  2. 一站式云原生智能告警运维平台——SLS新版告警发布!

    简介: 本文介绍什么是云原生可观测性需求以及告警限制,介绍一站式云原生智能告警运维平台--SLS新版告警. 前言 本篇是SLS新版告警系列宣传与培训的第一篇,后续我们会推出20+系列直播与实战培训视频 ...

  3. SLS 智能告警平台最新技术总结

    本文主要讲述过去一年内可观测平台 SLS 的改进和迭代. SLS 作为一站式的可观测平台,提供了对 Log.Metric.Trace 等数据的完整支持,包括数据存储.查询分析.ETL.可视化.监控告警 ...

  4. 【人工智能】未来企业建设AI需三大平台;仅靠算法不能落地智能,企业需要AI核心系统

    近日,由极客邦科技.InfoQ中国主办的"AICon人工智能与机器学习技术大会"在京举行.第四范式联合创始人.首席架构师胡时伟应邀出席并发表主题演讲.他认为,未来企业真正需要的不再 ...

  5. 智能云外呼系统,电销企业的新宠儿

    最近智能云外呼系统凭借着其优异的防封号能力,已经逐渐成为各电销企业的宠儿,并在销售过程中被广泛使用,企业借着外呼系统兴起的这股东风,进行了电销模式的转型,从传统模式到智能云外呼模式的转变,与之俱来的是 ...

  6. 企业打造智能工厂的核心系统——【MES系统】

    智能制造是新工业革命的核心,随着两化融合的不断发展推进,智慧制造的概念也已经不再陌生,它并不在于进一步提高设备的效率和精度,而是更加合理化和智能化地使用设备,通过智能运维实现制造业的价值最大化: 它聚 ...

  7. 特战基地之鸿蒙系统,鸿蒙操作系统开源是怎么回事?智能家居企业应该怎么做?...

    今天可以说是一个"华为日",因为鸿蒙终于来了. 它的出现或许会改变整个智慧生活,自此,世界将迎来一个全新的"全场景"时代. 是不是听着都相当牛逼.相当自豪?而华 ...

  8. 科技园区及科研实验室智能消防安全管控系统

    实验室是研究所开展科研活动的重要场所,保障实验室安全是科研工作顺利开展的必要条件和坚实基础,长期以来,实验室安全工作涉及危险化学品的监督管理,化学品的技术安全管理,以及实验室消防.环保等多方面的内容. ...

  9. 物联网应用系统三层结构的设计_基于物联网技术的智能油烟在线监测系统的设计与应用...

    摘要:餐饮业作为我国第三产业中一个重要的传统服务性行业,其因市场大.增长快.影响广.吸纳就业能力强的特点而广受重视.它经历了三十多年的发展与市场竞争,现在我国餐饮业发展已经进入了经营主体多样化和行业发 ...

  10. 基于智能矿山电力监控系统的设计与应用方法

    摘要:随着煤矿建设的智能化程度越来越高,构建智能电力监控系统实现对矿山生产的有效监控至关重要.首先分析了矿山电力监控系统存在的主要问题,其次重点介绍了基于智能矿山电力监控系统的设计过程,后提出了加强智 ...

最新文章

  1. plotly基于dataframe数据绘制散点图(scatter plot)
  2. python爬虫(二)_HTTP的请求和响应
  3. 平舌音 Z C S 的正确发音方式
  4. 【渝粤题库】国家开放大学2021春2019统计学原理题目
  5. C# 装箱和拆箱、理论概念(非原创)
  6. python天天向上的力量三天打鱼两天晒网_017 示例3-天天向上的力量-Go语言中文社区...
  7. lucene6.0 查询语句设置关键字boost值
  8. C语言是菜鸟和大神的分水岭
  9. 关于RDP协议的分析 附上RDP 协议初步分析.pdf文件
  10. 火星人谚语系列之四:对问题最深入的认识是知道答案
  11. 斯诺登给普通人开发了个「反监控」的 App
  12. VCF (Variant Call Format)格式详解
  13. thinkphp5 图片压缩旋转_26套经典压缩机结构设计:有多少人知道内部结构是这样的...
  14. 一个奇鸽船新体验:类似的木函软件
  15. 记 · 七言古诗 · 劝学
  16. 迷失在JAVA的咖啡杯中
  17. 首届大连国际樱花节将启幕
  18. 基于深度学习的红外和可见光图像融合论文及代码整理
  19. 计算机导航辅助教程,计算机导航辅助技术带给骨肿瘤外科医生的思考
  20. python:pprint实例

热门文章

  1. Android典型界面设计——ViewPage+Fragment实现区域顶部tab滑动切换
  2. MikroTik RouterOS 3.30 安装+免SSH全自动算号+自动注册L6图文全过程
  3. [android]实现拖动效果
  4. OpenCV实现摄像机标定和像素转换,surf寻找特征点,FLANN匹配算子进行匹配
  5. 力扣——分数排名(数据库的题
  6. 进阶篇:3.1.8)注塑件-成型不良的原因及调节方法详解
  7. Selenium 三种等待
  8. [2014-12-30]如何动态构造Lambda表达式(动态构造Lambda查询条件表达式)
  9. VMware的CentOS部署环境
  10. 用Python将一个文件夹下多个子文件夹中相同文件拷贝到同一个文件夹中并重新命名