简介:智能异常分析的检测结果通过 SLS 告警功能输出到用户配置的通知渠道。在智能巡检场景中,单个任务往往会巡检大量的实体对象,涉及到的对象规则很多,我们通过SLS新版告警可以实现较好的对于巡检事件的管理。

智能异常分析的检测结果通过 SLS 告警功能输出到用户配置的通知渠道。在智能巡检场景中,单个任务往往会巡检大量的实体对象,涉及到的对象规则很多,我们通过SLS新版告警可以实现较好的对于巡检事件的管理。

巡检事件基础结构

在这里,我们先简单看下巡检任务的基本逻辑:

对于单个巡检作业而言,内部包含N个实体的巡检,每个巡检实体对应一个巡检模型,其中任意一个异常事件产生后,都会通过告警系统通知到用户,因此我们需要有能力通过不同的方式将结果进行分发和管理。

我们先看下巡检事件的基础结构,具体的内置模板如下所示:

## 数据源
+ Project: ${results[0].project}
+ LogStore: ${results[0].store}##  异常对象
+ Entity: ${labels}## 异常程度
+ Score: ${annotations.anomaly_score}## 异常时序图
![image](${annotations.__plot_image__})[[数据详情](${query_url})]
[[作业详情](${alert_url})][[确认](${annotations.__ensure_url__})]
[[误报](${annotations.__mismatch_url__})]

我们一起来看下具体的告警消息的样例,接下来我们所有的描述都会根据对应的如下结果进行描述。

{"results": [{"store_type": "log","region": "cn-chengdu","project": "sls-ml-demo","store": "machine_metric_logtail","start_time": 1641361140,"end_time": 1641361200}],"labels": {"ip": "192.168.1.5","name": "load_avg"},"annotations": {"__ensure_url__": "$url_path","__mismatch_url__": "$url_path","__plot_image__": "$url_path","alert_msg_type": "ml_anomaly_msg","anomaly_score": "0.8000","anomaly_type_id": "1","anomaly_type_name": "STAB_TYPE","job_id": "29030-2bbf5beba0110fa869339708a8217b67","model_id": "9c0f0d5ad4879eb75237e2ec8494f5f1","title": "metric-logtail-sql"},"severity": 8,"drill_down_url": "$url_path"
}

典型场景配置

场景一

目标:过滤特定实体的异常

操作步骤

  • 寻找到某个巡检任务的【行动策略ID】,这里要根据用户自己的实际配置来确定,具体的路径如下:

  • 在行动策略中,添加对应的条件

  • 根据上述提供的告警字段而言,我们假设目前只将【标签】中字段为【ip】且值为【192.168.1.5】的告警消息发送到特定的【钉钉机器人】中

场景二

目标:过滤特定分数的异常

操作步骤

  • 找到特定的【行动策略ID】,添加【条件】
  • 配置【异常分数】超过【0.9】分数以上的告警到特定的渠道
  • 【名称】- anomaly_score
  • 【正则】- ^((1\.0*)|(0\.9[0-9]*))$

场景三

目标:过滤特定实体的特定分数的异常

操作步骤

  • 找到特定的【行动策略ID】,添加【条件】
  • 配置【特定实体】的【异常分数】超过【0.9】分数以上的告警到特定的渠道
  • 【标注】的名称设置为 anomaly_score,【正则】- ^((1\.0*)|(0\.9[0-9]*))$
  • 【标签】的名称设置为 ip,对应的实体内容是 192.168.1.5

场景四

目标:过滤特定异常类型的异常

操作步骤

  • 找到特定的【行动策略ID】,添加【条件】
  • 配置【特定异常形态】
  • 配置【标注】anomaly_type_id,根据对应的值进行判别,具体的内容可以参考[异常类型说明](异常类型说明 - 日志服务 - 阿里云)
  • 这里只接受特定的【向上漂移类型的异常】anomaly_type_id = 7

场景五

目标:根据巡检事件和根因事件类型进行分发

操作步骤

  • 找到特定的【行动策略ID】,添加【条件】
  • 配置【智能告警的事件类型】
  • 配置【标注】alert_msg_type,对应的值是 ml_anomaly_msg (这个字段表示的是智能巡检的告警)

原文链接

本文为阿里云原创内容,未经允许不得转载。

智能巡检告警配置实践相关推荐

  1. ES智能巡检开发设计实践

    项目背景 PaaS 下管理了大量集群,监控和告警能快速的让开发维护人员,知道系统已经发生故障,并且辅助高效排障. 但是无法提前预知集群的健康状况,开发人员和维护人员均无法在故障前及时作出调整.为了帮助 ...

  2. 智能巡检云监控指标的实践

    简介:在真实的企业生产中,对研发和运维的同学都会面临一个十分繁复且艰难的问题,就是对指标的监控和告警.具体我枚举一些特定的问题请对号入座,看看在算力爆炸的时代能否通过算力和算法一起解决! 背景介绍 在 ...

  3. BethuneX:DBA最信赖的监控和智能巡检平台

    8月29日,云和恩墨召开软件产品发布会,推出了BethuneX数据库实时监控和智能巡检平台,近500名恩墨伙伴共同见证了这一时刻.BethuneX的智慧+灵动全新体验,将带给用户对数据库监控巡检的无限 ...

  4. 云和恩墨 oracle 监控,产品速递 | 云和恩墨Bethune Pro2——数据库实时监控和智能巡检平台...

    运维工程师负责企业IT系统的日常维护工作,包括每日的系统巡检,日常的系统健康信息监控. 通过使用 Bethune Pro2,工程师可以通过每日巡检建议,快捷的感知各个数据库中存在的隐患与风险点.同时, ...

  5. 虹口区巡检机器人_5G智能巡检机器人就在身边

    5G智能巡检机器人.5G无人驾驶清扫车.5G工程机械远程交互--贵州移动数博会展厅的一众机器人个个都是颜值担当,个个都身怀绝技.与4G环境不同,搭载了移动5G技术的智能机器人更具稳定性和安全性,被赋予 ...

  6. 巡检人员定位系统是如何实现智能巡检的?

    巡检人员定位系统主要是以人员定位为基础,依托现代技术预设巡检路线,自动传输设备检测数值,发现异常自动上报,采用通络通信.射频识别等技术确保巡检人员的真实到位,同时实现巡检全过程的可视化. 尽管一直在强 ...

  7. Bethune 智能巡检平台,伴你度过运维平安夜

    各位亲爱的小伙伴, Tick tick, 又一年的圣诞节快到了,小编在这里先提前祝大家"Merry Christmas",同时带来一个好消息:为了让奋战在一线的 DBA 能度过一个 ...

  8. 华微电力智能巡检系统帮助广州供电局成倍提高输电线路巡检的效率和质量

    解决方案概要 客户名称:广州供电局 客户简介: 广州供电局是中国南方电网广东电网公司的下属子公司.广州供电局输电部管理着华南地区最庞大的输电网络,包括线路170多条.杆塔7600多基. 广州供电局的信 ...

  9. 智能车技术与实践_ROS入门

    智能车技术与实践--ROS入门 前言:本次作业旨在通过不同的任务使同学掌握ROS基础,包括工作环境.功能包的创建. 预先要求:ubuntu18.04 + ROS melodic 任务一:创建ROS工作 ...

最新文章

  1. [ACM] hdu 1253 胜利大逃亡 (三维BFS)
  2. 数据蒋堂 | 为什么我们需要C程序员
  3. ls实现列文件按时间排序
  4. python中math模块函数_Python常用的一些内建函数和math模块函数
  5. 苹果cms怎么添加友情链接图文教程
  6. html整体布局居中,html 居中布局
  7. 报表系统服务器故障,报表服务器服务启动时的错误消息 - SQL Server | Microsoft Docs...
  8. 读书笔记 大前研一 《M型社会》
  9. java area类用法_java反射
  10. solr定时实时重建索引和增量更新——sxt
  11. (详细)华为畅享6S DIG-AL00的usb调试模式在哪里打开的教程
  12. 【链块技术10期】区块链基础语言(二)——GO语言开发环境搭建
  13. 汽车纵向动力学模型简介(汽车动力学建模入门知识)
  14. 技侦十所 技侦科技局
  15. Teradata 数据库介绍
  16. 关于“茴香豆的‘茴’有几种写法”:学习过程中,若时间精力有限则优先记住最好用的一种
  17. 奋斗五年,从月薪三千五到七百万(转载)
  18. 【Rtklib入门指南】1. Rtklib下载及编译
  19. 用源代码安装fping5.0
  20. linux启动桌面autostart,autostart

热门文章

  1. php soecket服务器搭建_PHP socket 服务器框架集
  2. word 编辑域中的汉字_15条Word常用操作教程,简单实用,纯干货分享,收藏备用!...
  3. 计算机英语A卷答案,计算机专业英语试题及答案A卷.doc
  4. html中什么是语义,html – “语义正确”是什么意思?
  5. java引入bean代码_通过java代码装配bean
  6. 合并 多个dataframe_什么是Pandas的DataFrame?
  7. tensorflow越跑越慢_tensorflow如何解决越运行越慢的问题
  8. python类实例化_python基础8之类的实例化过程剖析
  9. cups共享linux打印机_linux入门-映射网络驱动器
  10. php curl header_PHP中的yield与协程(二十一节)