原文发表于kubernetes中文社区,为作者原创翻译 ,原文地址

更多kubernetes文章,请多关注kubernetes中文社区

目录

DevOps团队如何选择监控工具

在哪里实施监控

你需要从数据中得到什么

开源与付费

开源监控工具

付费的监控工具

监控工具的对比


DevOps团队如何选择监控工具

组织在采用DevOps后,每一步的决策都离不开数据。因此,如果不仔细监控系统正常运行时间,网络负载和资源使用情况等关键指标,你将无法准备知道在系统哪部分花精力进行开发或优化。幸运的是,可以使用各种各样的监控工具来帮助你收集和查看此数据。

确定监控什么以及如何进行监控,这很重要。在这篇文章中,我们将带你了解基础的监控知识,我们还将列举一些流行的监控工具供你参考。

在哪里实施监控

首先,你需要确定在系统中的哪个位置实施监控。根据监控的位置,你将能够观察不同类型的数据。以下是最常见的监控类型,以及提供该监控类型的工具。

资源监控:也称为服务器监控或基础结构监控,它通过收集有关服务器运行方式的数据来进行操作。资源监控工具报告RAM使用情况,CPU负载和剩余磁盘空间。这些有关硬件运行状况的信息(例如CPU温度等),也影响着服务正常运行。在基于云的环境中,虚拟服务器的聚合信息更为有用。

网络监控:这将查看计算机网络进出的数据。你的监控工具可以捕获有关组件(如交换机,防火墙,服务器等)中的所有请求和响应。

应用程序性能监控: APM解决方案收集有关服务运行情况的数据。通过这些工具,我们可以对应用程序性能问题的检测和诊断,以确保服务以预期的水平运行。

第三方组件监控:这涉及监控体系结构中第三方组件的运行状况和可用性。在这个微服务时代,你的服务可能取决于外部服务(例如:数据库、消息中间件)的正常运行。

你可能希望在监控解决方案中包括每种监控类型,那就优先考虑使用健壮的监控工具,以确保不会遗漏潜在问题。同时,监控指标和警报联系在一起,以确保能够及时收到业务运行故障信息。

你需要从数据中得到什么

监控工具中的数据,可以做如下一些事情:

  • 当监控指标超过特定阈值时触发警报

  • 创建一段时间内的指标图

  • 直观展示关键服务运行状况组件的仪表板

  • 创建可以查询的日志数据库

开源与付费

要考虑的另一个重要点是在哪里可以找到监控工具以及由谁来维护它们。既有开放源代码,也有可购买的工具,它们各有利弊。

开源监控工具

这些工具是免费的,这对于预算有限的公司来说是一个优势。它们也是完全可定制的,允许你将它们集成到软件系统架构中。但是,这种定制将需要专门的开发时间,并且可能需要专门的知识。此外,你的团队还需要保证可用性,安全性,更新频率等。

付费的监控工具

这些工具成本高昂,但具有开源工具无法提供的强大功能。服务提供商将负责保持工具的功能和最新状态。该提供商可能会提供客户服务,培训,文档和其他资源,以帮助你将工具与业务系统集成。并且,可靠性也不错。

监控工具的对比

以下是DevOps中最受欢迎的监控工具,供你的系统使用。

  • AppDynamics是专注于APM的监控平台。他们还提供的其他功能包括AI观察,终端用户监控以及具有整体数据分析的业务监控。你可以注册免费试用。

  • DataDog是一个针对云服务的监控平台。它在可视化,警报以及数据合并和分析方面具有强大的功能。它们使性能指标与业务紧密关联。DataDog提供免费试用。

  • Prometheus是一种流行的开源监控工具,提供警报,查询,可视化和许多其他有用的功能。开发社区提供了大量文档和说明,以帮助你快速入门。

  • New Relic是一个监控平台,提供了几个也可以独立使用的组件:New Relic APM(应用程序性能监控),New Relic Browser和New Relic Infrastructure。他们提供了适用于iOS和Android的应用程序,为你提供了更多监控选项。

  • Nagios提供开源(Nagios Core)和可购买的选择(Nagios XI)。它们提供了高度可定制的界面,并可以监控整个IT网络。它们还通过配置向导来突出其易用性,以引导用户设置新的监控服务。

  • Dynatrace允许其监控平台进行跨团队协作,从而提供共享的单个监控数据存储库。它们还包括自治功能以及物联网层监控的能力。他们还提供免费试用。

  • Solarwinds提供了几种产品,每种产品专门用于监控的不同领域:网络管理,系统管理,数据库管理,IT安全,IT服务管理,应用程序管理和托管服务提供商。每个都可以免费试用。

  • Site24x7专门从事网站监控,提供诸如状态页和Web服务(例如AWS和Azure)运行状况诊断的工具。它们还提供综合Web事务监控,使你可以模拟使用情况并收集指标。他们根据所需的服务提供几种付费标准。

  • SignalFx提供了广泛的微服务集成,使你可以看到服务运行状况的完整状况。如果你的服务包含许多第三方组件,则这一点很重要。他们可以帮助你从单体架构过渡到微服务架构。

  • PRTG Network Monitor是一项完整的监控服务,可以集成到软件系统中的许多阶段和位置。它们在网络,服务器,应用程序上提供监控。该提供程序还提供免费版本。

无论最终使用哪种监控工具,都要在保证可靠性的基础上,充分利用它们提供的数据。

译文链接: https://dzone.com/articles/how-to-choose-monitoring-tools-for-devops-and-sre

DevOps团队如何选择监控工具相关推荐

  1. 大话DevOps监控,团队如何选择监控工具?

    Hi!我们是DevSecOps研发安全运营一体化解决方案提供商.Atlassian全球白金合作伙伴--龙智.在过去的十多年间,传统软件研发模式发生巨变,从瀑布式开发到敏捷再到DevOps,开发和运维之 ...

  2. “安全即代码”:整合安全团队和DevOps团队

    随着云计算开发和部署变得越来越快且越来越灵活,安全团队意识到,保护云应用和系统部署的唯一有效方法是开发可整合到部署管道的安全控制,以及尽可能自动化.安全社区很多人将这种方法称为安全即代码,这是采用基础 ...

  3. DevOps团队绩效考核重点

    前面的文章中介绍了DevOps的概念以及其落地经验,参考如下: DevOps究竟能给企业解决什么问题 Devops 落地的核心和13条经验总结 今天我来介绍一下在Devops体系中对项目团队效能方面的 ...

  4. DevOps团队结构类型汇总:总有一款适合你

    前言 组织中任何DevOps工作的主要目标都是改进客户和业务的价值交付,而不是降低成本.提升自动化或者通过配置管理驱动一切:这意味着,为了实现有效的Dev和Ops协同,不同的组织可能需要不同的团队结构 ...

  5. 理想化的DevOps团队里只需要有Dev就够了?

    (图片来源于网络) 几天前,本公众号发布的一篇译文列举了9种DevOps团队结构适用类型与7种反型(点击查看原文).文章转发到朋友圈之后,很多DevOps同行留言(吐槽)了自己团队的现状,其中大部分人 ...

  6. java团队名字_作为一名Java工程师,我在DevOps团队都经历了什么

    原标题:作为一名Java工程师,我在DevOps团队都经历了什么 作者 | Milan Milosevic 译者 | 无明 我是一名 Java 工程师.每当听到其他 DevOps 工程师讲述他们遇到的 ...

  7. DevOps团队如何为网络星期一做准备

    通过AppDynamics解决应用程序问题的速度提高了10倍–以最小的开销在代码级深度监视生产应用程序. 开始免费试用! 当我们带着与家人和朋友放松身心的想法进入感恩节周末时,会有一群人一直在工作或随 ...

  8. DevOps 团队必备的 3 种指标监测工具

    指标仪表板帮助 DevOps 团队监控整个 DevOps 平台,以便实时响应议题issue.在处理生产环境宕机或者应用服务中断等情况时,指标仪表板显得尤为重要. DevOps 仪表板聚合了多个监测工具 ...

  9. 使用devops的团队_跨职能DevOps团队的8个角色

    使用devops的团队 如果您刚开始使用小队模型,则可能不确定团队要顺利运作需要哪些角色. 我们在IBM Digital Business Group中的小队模型基于Spotify Squad框架 . ...

  10. 成就高效DevOps团队的“降龙十八掌”第一式——codeReview?

    什么不是codeReview Code reviews 不应该承担发现代码错误的职责. Code Review主要是审核代码的质量,如可读性,可维护性,以及程序的逻辑和对需求和设计的实现.代码中的bu ...

最新文章

  1. 32边界的链码表示MPP算法MATLAB实现
  2. Totem-DesignNet处理器插件开发方法
  3. 如何使用iPad移动办公
  4. CodeForces - 1364C Ehab and Prefix MEX(贪心+构造)
  5. word List 24
  6. 160 - 38 CyberBlade.2
  7. 用几张图片教你,财务分析的平台、架构、指标体系、模型
  8. jqgrid columnChooser列的自定义及存储和获取
  9. python控制多台手机,用python同时启动多个appium,并让多个手机同时执行脚本
  10. Android 系统(91)---Android 平台调试
  11. MyBatis参数为Integer型并赋值为0时判断失误的问题解决
  12. 萨维奇(Savitch)定理证明
  13. linux+企业微信+api,概述 - 企业微信API
  14. 工作态度决定了工作结果
  15. IDEA mybatis XML文件格式化问题
  16. 指数函数,幂函数记录
  17. includes() 方法
  18. 微信小程序 MinUI 组件库系列之 abnor 异常流组件 1
  19. 后台cs代码控制html控件,在asp.net中*.aspx.cs肿么用后台代码编写前台的事件?
  20. 中职计算机网络技术教学大纲,中职中专学校《计算机网络基础》教学大纲.doc...

热门文章

  1. c语言 16进制编辑器,十六进制编辑器(010 Editor 32位)
  2. 微信电脑版调整字体大小的办法
  3. ubuntu20.04下的录屏与视频剪辑软件
  4. Python调用海康威视网络相机_调用海康SDK
  5. 网上书店动态网页设计
  6. 版本管理工具git常用命令
  7. layui参考文档地址
  8. 杂勘复Intrepid Geophysics GeoModeller 2016 v3.3.0 Win64 1CD质模建
  9. ESP32-CAM + micropython学习笔记
  10. fp算法例题_大部分人都理解错了的FPgrowth算法