对警报线程池的警报线程

对于所有DevOps团队来说,辛苦的工作是一件令人担忧的事情。 辛劳产生的原因很多。 这使它成为一个非常棘手的问题,几乎不可能完全消除。 因此,团队必须解决的最佳策略是尽可能地减少他们。 在这篇文章中,我们讨论了由于不良的警报和传呼习惯而导致的辛劳管理的一些基础知识。


辛劳源于工程师在执行通常可以自动化或避免的任务时必须花费的精力。 一般而言,在一段时间内觉得不必要的工程任务会造成最大的负担。 Google SRE本书将Toil定义为可以“手​​动,重复,可自动化,战术,没有持久价值并且随着服务的增长呈线性扩展”的任务。

让我们看一个例子,说明不良的警报做法如何为采用DevOps做法的团队带来辛劳。

假设您正在使用AWS在生产上运行Web应用程序。 您具有标准设置。 还有一个确定何时应扩展或扩展Auto Scaling组的扩展策略。但是,如果未正确设置扩展策略怎么办? 如果选择了错误的阈值怎么办? 这就是为您的团队发挥作用的方式……

  • 您的主机将发出有关CPU /内存耗尽的警报。
  • 越来越多的5xx响应将触发Cloudwatch的警报
  • Pingdom检查将开始报告加载时间增加或响应失败,并向您发送警报
  • 应用程序日志将开始记录更多错误。 任何日志监视都将基于此开始发出警报。
  • 增加的日志还可能触发磁盘I / O警报。

可能还会触发许多其他警报。 虽然所有这些都代表问题,但这里的根本问题是扩展策略不佳。


并非总能获得根本原因的警报。 但是,这不是让工程师不知所措的借口。 这种情况也说明了上下文切换,警报设置成本以及响应和诊断成本如何快速增加。 警报所依据的信号不佳是此问题的核心。

这是我们在构建Plumbr时要解决的问题之一。 Plumbr在应用程序监视和实际用户监视的交叉点工作。 因为Plumbr基于从实际使用中收集的数据,所以它最准确地反映了用户与Web应用程序交互时的体验。

需要更好地将重要警报与出现的嘈杂警报区分开。 因此,警报信号的重要来源是使用来自应用程序实际使用的数据。 实际的用户监视将重点放在用户和使用上,而不是系统级的行为。 这形成了更客观的警报基础。 没有人可以否认,如果用户受到的影响超出一定水平,工程师必须记录下来并开始调查修补程序。 根本原因是数据库问题,CPU配置,PaaS上的扩展策略还是第三方基础结构故障–如果用户受到不利影响,则可以合理地提醒工程师。

您的团队还可以使用真实的用户监视数据为警报和寻呼提供更好的基础。 立即开始免费的Plumbr试用 。 免费享受我们为期14天的完整功能集。

PS:不可能在一个文档中解释有关劳动的所有内容。 但是,我们关心工程师能够专注于重要的事情。 我们已经 发布了一份白皮书,该白皮书 更深入地讨论了劳动问题。 对于更多的视觉学习者,我们还将此信息作为 点播网络研讨会发布 在这里。 干杯!

翻译自: https://www.javacodegeeks.com/2019/08/toil-arising-alerting.html

对警报线程池的警报线程

对警报线程池的警报线程_警报引起的辛劳相关推荐

  1. 线程池传递对象参数_一次线程池参数错误引起的线上故障

    在JAVA里,我们通常会把没有前后依赖关系的逻辑操作扔到多个线程里并行执行,以提高代码运行效率. 同时,我们一般也不会单独显式创建线程,而是通过线程池设置线程.使用线程池的好处是减少在创建和销毁线程上 ...

  2. python 判断线程是否执行完毕_判断线程池中的线程是否全部执行完毕

    在使用多线程的时候有时候我们会使用 java.util.concurrent.Executors的线程池,当多个线程异步执行的时候,我们往往不好判断是否线程池中所有的子线程都已经执行完毕,但有时候这种 ...

  3. java线程池原理简答_面试官让我讲讲Java线程池的实现原理,我笑了...

    期待与你,一起进步 随着cpu核数越来越多,不可避免的利用多线程技术以充分利用其计算能力.所以,多线程技术是服务端开发人员必须掌握的技术. 线程的创建和销毁,都涉及到系统调用,比较消耗系统资源,所以就 ...

  4. java线程池的面试题_献给准备面试的你,Java线程and线程池面试题小结

    最近这几天一直在整理Java相关的面试题,"金九银十"是求职的最佳时间,但是现在的"银十"也已经过去了一半的时间,相信现在还在为面试四处奔波的小伙伴已经很疲惫了 ...

  5. 线程池:治理线程的法宝

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试资料 作者:Oo鲁毅oO juejin.im/post/5e1b1fcc ...

  6. 一个线程池中的线程异常了,那么线程池会怎么处理这个线程?

    一个线程池中的线程异常了,那么线程池会怎么处理这个线程? 参考文章: (1)一个线程池中的线程异常了,那么线程池会怎么处理这个线程? (2)https://www.cnblogs.com/fangua ...

  7. 【Java 并发编程】线程池机制 ( 线程池阻塞队列 | 线程池拒绝策略 | 使用 ThreadPoolExecutor 自定义线程池参数 )

    文章目录 一.线程池阻塞队列 二.拒绝策略 三.使用 ThreadPoolExecutor 自定义线程池参数 一.线程池阻塞队列 线程池阻塞队列是线程池创建的第 555 个参数 : BlockingQ ...

  8. 【Java 并发编程】线程池机制 ( ThreadPoolExecutor 线程池构造参数分析 | 核心线程数 | 最大线程数 | 非核心线程存活时间 | 任务阻塞队列 )

    文章目录 前言 一.ThreadPoolExecutor 构造参数 二.newCachedThreadPool 参数分析 三.newFixedThreadPool 参数分析 四.newSingleTh ...

  9. 【Android 异步操作】线程池 ( Worker 简介 | 线程池中的工作流程 runWorker | 从线程池任务队列中获取任务 getTask )

    文章目录 一.线程池中的 Worker ( 工作者 ) 二.线程池中的工作流程 runWorker 三.线程池任务队列中获取任务 getTask 在博客 [Android 异步操作]线程池 ( 线程池 ...

  10. 【Android 异步操作】线程池 ( 线程池简介 | 线程池初始化方法 | 线程池种类 | AsyncTask 使用线程池示例 )

    文章目录 一.线程池简介 二.线程池初始化方法简介 三.线程池使用示例 一.线程池简介 线程池一般是实现了 ExecutorService 接口的类 , 一般使用 ThreadPoolExecutor ...

最新文章

  1. fastlane自动打包--详细介绍
  2. 深耕大数据市场,所问数据打造深度学习数据分析与预测引擎
  3. 据说这是中途接手别人项目时的场景
  4. RuntimeError: Cannot run the event loop while another loop is running
  5. JAX-RS 2.0:服务器端处理管道
  6. Java线程面试的前50个问题,面向初学者和经验丰富的程序员
  7. 基于linux 的2048
  8. 蓝桥杯(java)基础练习 龟兔赛跑
  9. mvp内粗泄露问题_如何在一天内从MVP转到生产服务器
  10. 标准BT.656并行数据结构
  11. setInterval()与setTimeout()计时器
  12. Java编写五线谱上的音符_五线谱入门(三)——音符详解
  13. 【技巧】Windows 10系统连接共享打印机报错0x00000709、0x0000007c、0x0000011b
  14. 软件测试面试英文自我介绍,软件测试英文面试自我介绍范文
  15. 所谓的成长就是认知升级-成长就是应付自如
  16. Python编程小记:基本语法
  17. 考取IT职业资格证书相关信息
  18. 计算机考研英语复试专有名词翻译
  19. java播放音频文件mp3
  20. Web、app、H5、小程序测试的区别

热门文章

  1. Flutter 自定义Dialog
  2. cm13编译中的local manifest写法
  3. 模板——函数模板与类模板
  4. 【算法设计与分析】算法的时间复杂度(介绍O渐近上界,Ω渐近下界,θ准确的界)
  5. HTML隐藏属性的使用
  6. mysqld: Too many arguments (first extra is 'start').
  7. 经典功率谱估计及其实现
  8. 接口文档以及接口测试用例
  9. java 切面顺序_spring 多个切面如何有序执行
  10. 集装箱港口智能化管理解决方案