第1章 云计算时代的监控系统
1.1 云计算时代的应用系统 1.1.1  企业“IT云化”实现数字化转型 1.1.2 云计算时代的IT架构特点 1.1.3 云计算时代的IT管理变革 1.企业IT投入模式改变在传统的IT模式下,基础设施的投入占比最大,服务器运维人工成本次之,应用开发的投入占比最小。上云后,投入比例相反。2.IT人员能力要求改变 传统IT人员更关注底层基础设施的运维,项目管理,对业务需求的理解和响应比较被动。云计算IT人员需要更关注业务的需求,探索新的业务模式,主动发现客户的需求,寻找新的技术和解决方案,而不仅仅关心底层平台的运维和资源管理。在云计算环境下,这种思路发生了根本性改变,"创建比修复更容易",只需要迅速下架或释放有问题的资源,同时开通对应的新资源。至于产生问题的根本,可以留给云计算服务商的工程师去思考解决。3.关注用户体验和业务指标如果没能详细的了解服务中各种行为的重要程度,不去度量这些行为的正确性,就无法正确维护这个应用系统,更不要说保障系统的可靠,稳定的运行了。不管是对外的服务,还是内部API,都需要制定一个针对用户的服务质量目标,并且努力达到。在这个过程中,需要利用一些主观判断结合过去的经验以及对服务的理解来定义一些服务质量指标(SLI),服务质量目标(SLO),以及服务质量协议(SLA)。这三项指标分别指该服务最重要的一些基础指标,这些指标的预期值,以及当指标不符合预期时的对应计划。事先选择合适的指标有助于在故障发生时帮助维护团队做出更好的决策,同时也为维护团队判断系统是否正常提供帮助。1.2 云计算监控的目标和挑战 1.2.1 云计算监控目标 监控是运维团队眼睛的延伸。监控系统需要有效的支持白盒监控和黑盒监控。通过白盒监控能够了解内部的实际运行状态,观察监控指标能够判断可能出现的问题,从而对潜在的不确定因素进行优化。而黑盒监控,常见的如 http 探针,tcp探针等,可以在系统或者服务发生故障时快速通知相关人员进行处理。通过建立完善的监控体系,可以达到下面的目标:1.长期趋势分析2.对照分析3.告警4.故障分析与定位5.数据可视化1.2.2 云计算监控挑战 挑战1:持续变更在一个大型复杂环境中,变更是常态。挑战2:自下而上还是自上而下采用自下而上的方式进行监控:根据聚合值,底层中的错误和单个模块中的错误,可以在它们传播和影响到上层应用服务器或者应用本身之前被发现。这里面临的挑战是:1.需要部署越来越多的模块级别和其他低级别的内容。2.在云中,底层基础设施和服务器之间有正常和异常的分配。采用自上而下的监控方法基于云的和高度复杂的系统是解决以上问题的一种尝试,通过监控上层或者聚合数据,从顶层问题再出发以智能的方式深入底层数据。仍然必须收集底层数据,但不会系统化的监控错误,这种也面临挑战:1.发现问题可能已经为时已晚2.如何深入底层数据现代分布式系统有内置的容错机制来掩盖故障和错误,防止在系统层面出现问题直接影响用户体验,因此,检测到上层问题距离底层根本故障原因出现,可能已经过去相当一段时间了。3.从最初发生故障到扩散到整个系统变得明显,可能需要经过很长一段时间。不能简单的依赖上层错误检测的时间戳。挑战3:复杂的微服务架构每个外部请求都可能要穿越大量内部服务才能得到相应。挑战4:大容量的分布式数据监控时间会引入大量性能,传输和存储方面的巨大开销。1.3 云计算监控的范围和架构 1.3.1 监控管理的范围 1.3.2 监控系统的基本架构 1.4 百花齐放的开源监控软件工具 1.4.1 监控系统成熟度 监控系统有4个发展阶段,也就度量监控系统的方法,以及对监控改进的指南,可用于评估当前监控系统的成熟度级别以及可采用的改进步骤。第一级,是组件监控,可以反映每个组件的状态并根据策略进行报警通知。第二级,是对各层级进行监控,从各层级,角度收集运行信息,包括各种指标度量值,输出日志,服务追踪信息等。第三级,不仅查看所有的状态,事件和度量,还查看依赖关系并追踪动态变更情况,数据用可视化工具展现,以实时洞察整个系统的总体运行情况。第四级,是智能化,能够在发生故障之前发送报警,通过扩展或者重路由服务来实现自我自愈,异常监测等。当监控成熟度从第1级 晋升到第2级,将获得对系统更深入的洞察力,将更好的理解服务的可用性和性能。从第2级到第3级,将可以在整个IT系统中获得全栈的可见性,并精确的理解业务,应用程序和基础架构之间的依赖关系。进入第4级时,将获得预测分析能力,这将帮助企业预测可能发生的问题,指出可能的原因。对于监控系统软件,开源的解决方案有 :流量监控(MRTG,Cacti,Smokeping,Graphite等)性能监控(Nagios,Zabbix,Zenoss Core,Ganglia,OpenTSDB等)1.4.2 Zabbix 1.4.3 OpenTSDB 1.5 Prometheus监控系统 Prometheus(普罗米修斯)是一个开源的容器和微服务检测和预警工具。Prometheus 由 Google 的 Brogmon 监控系统启发而来。1.5.1 应运而生,茁壮成长 Prometheus 关注的是近期发生的事情。Prometheus 假设用户视图修复的问题是最近的,因此默认保留15天的数据。Prometheus 还有一个推送网关,可以用来接收少量数据,例如获取不能直接被抓取的监控目标的指标数据。1.5.2 功能完善、监控所有层级指标 传统的监控方案需要多种监控工具组合,Prometheus 功能强大,可以监控所有层级的指标。1.5.3 开放、高效、易用的完整解决方案 优点:1.易管理型2.更契合的架构3.灵活的数据模型4.良好的性能,强大的查询能力5.可扩展性6.健全的生态,开放,易于与第三方系统集成7.可视化

1.Prometheus 监控技术与实践 --- 云计算时代的监控系统相关推荐

  1. 视频监控技术 迎来网络“多媒体”时代

    来源:全球IP通信联盟 互联网技术及应用的飞速发展已经影响到各个领域,利用廉价的IP网络资源,完成对监控图像的动态实时传输,使人们已经基本实现了在任何地点(Anywhere).任何时间(Anytime ...

  2. 云计算时代,数据中心运维应该注意哪些问题?

    云计算时代,数据中心运维应该注意哪些问题? 在云计算时代,IT系统建设越来越成为企业发展至关重要的一环.业务系统,以及支撑业务系统运行的基础设施通常是企业关注的首要目标;然而,保障业务健康运行的背后& ...

  3. 数据中心linux运维学习_云计算时代数据中心运维三大要点

    在当前企业IT系统向云架构转型的时刻,运维系统再一次面临着新的挑战.所以在数据中心运维的时候,运维人员应该注意哪些问题? 在云计算时代,IT系统建设越来越成为企业发展至关重要的一环.业务系统,以及支撑 ...

  4. 国内智能视频分析监控技术的出路

    国内智能视频分析监控技术的出路 ^来自网络,免费共享 一.什么叫智能视频分析监控技术 2007年来,智能视频分析监控技术成了安防领域的一个热点话题,影响越来越大越来越广,对此,人人都有自己的理解.但做 ...

  5. 智能视频分析监控技术

    一.什么叫智能视频分析监控技术       2007年来,智能视频分析监控技术成了安防领域的一个热点话题,影响越来越大越来越广,对此,人人都有自己的理解.但做为一种新的事物新的技术,真正明白它的人并不 ...

  6. 揭秘:美国警方监控技术大曝光

    揭秘:美国警方监控技术大曝光 责任编辑:editor005 作者:Alpha_h4ck |  2016-09-14 15:41:16 本文摘自:黑客与极客 近日,The Intercept曝光了美国执 ...

  7. 对云计算时代软件技术发展的若干思考和实践和软件工程技术思索 读后感

    观<对云计算时代软件技术发展的若干思考和实践>(梅宏)后感 看完这篇文章,感觉云里雾里的,头脑有点蒙了.什么是云计算?云计算有着不同的定义,作者的观点是:云计算在某种意义上,它就是一种新一 ...

  8. 《云计算架构技术与实践》连载(2):1.2 云计算的发展趋势

    <云计算架构技术与实践>连载(2):1.2 云计算的发展趋势 版权所有,未经华为书面许可,请勿转载或转发. 由于技术方面的限制,前面几年云计算的主要应用仍然仅仅局限在互联网领域以及规模有限 ...

  9. 技术沙龙 | 云时代下的架构演进—企业云及云原生技术落地实践

    云改变了IT行业的形态和市场格局,催生了应用的发展.随着云计算技术的不断演进,作为一名优秀的架构师,必须深入了解云计算平台的特点及架构设计,包括构建数据库.大规模落地微服务.Service Mesh和 ...

  10. 云计算时代——本质、技术、创新、战略

    云计算时代--本质.技术.创新.战略(一线云计算布道师历时6年力作,透析云计算本质.简述云计算关键技术.分析主要云服务架构.解剖云计算巨头策略,既有广度又有深度,云计算2.0时代必备) 刘黎明 王昭顺 ...

最新文章

  1. swift 字符串中查找字符位置
  2. ASP.NET防止页面刷新的方法
  3. 对象数组 NullPointerException异常--将图C++ 改为java版
  4. python递归排序组合_如何用Python求list的排列组合:一种递归方式
  5. 160809325贺彦
  6. 【转】DICOM医学图像处理:基于DCMTK工具包学习和分析worklist
  7. Spring-data-jpa常用方法
  8. springmvc工作流程_SpringMVC工作原理
  9. 磁力mysql搜索_多功能搜索 搜索系统安装 小说 电影 磁力
  10. 代码的抽象三原则【转载】
  11. SVD 与 PCA 的直观解释(1): 线性变换
  12. Spring Boot+JPA 查询数据方式与代码演示
  13. [置顶] Android之Handler用法总结
  14. mysql中dint_mysql常用操作——数据库和表的操作1(共2页)
  15. 利用python处理excel文件并可视化处理-python如何将excel数据处理可视化
  16. 抓包安卓7以上ca证书安装方法
  17. Android实现税博客,Android个人所得税计算器
  18. 腾达无线路由器dns服务器,腾达路由器怎么手动设置dns地址
  19. 集成墙面拆后恐怖极了,没想到这么美!
  20. 高级篇Docker复杂安装详说

热门文章

  1. 安卓ListView行详细内容展示页编写和下拉刷新实现
  2. hibernate第一天
  3. centos7 安装docker-ce ,最新版本docker,docker阿里云加速
  4. JQuery源码分析 --- 运动animate 基本原理
  5. python学习笔记之hashlib
  6. canvas和svg
  7. BZOJ3997 TJOI2015组合数学(动态规划)
  8. MYSQL5.6和5.7编译标准化安装与配置
  9. border做三角符号
  10. 24-语言入门-24-cigarettes