导读:今天起,“凌云时刻”特别推出“阿里云玩转 ECS”系列课程,每周二、周四固定更新,欢迎关注。本期为系列第 1 讲,由阿里云资深技术专家吴君印介绍上云最正确的部署和运维方式。

嘉宾 | 吴君印

整理 | 董黎明

前言

云上部署和运维相对于传统方法而言更加灵活,只需要编写一次模版就可以随时随地拉起一套环境,做到一键部署。同时支持多环境部署、操作可审计、支持 DevOps 实践。本次分享由阿里云资深技术专家吴君印为大家介绍上云最正确的部署和运维方式,结合阿里的最佳实践,打造快速、安全、可复制、标准化的 DevOps 体验。

吴君印,阿里云资深技术专家。负责 ECS 整体服务层面的技术和产品架构工作,并负责阿里云智能内部 OnECS 的技术和产品架构工作,包括产品 ECS 云助手,运维编排 OOS,资源编排 ROS 以及内部 OnECS 产品宙斯,致力于打造以 ECS 为中心的系统管理、自动化和 DevOps 体验。

以下内容根据演讲视频以及 PPT 整理而成,点击文末“阅读原文”可观看视频回放。

本次分享主要围绕以下三个方面:

1. 云上部署和运维的特点

2. 资源编排 ROS

3. 运维编排 OOS

今天主要分享的内容是云上自动化部署和运维的正确姿势,下面先来看看云上部署相比于传统的 RDC 部署有哪些不同。

云上部署和运维的特点

无论是部署还是运维,在云上都有如下四个特点:

首先,可重复。在云上部署相对于传统 RDC 部署而言更加灵活,只需要编写一次模版就可以随时随地拉起一套环境,做到一键部署。目前有两种类型的环境部署,一种是测试环境、预发环境、生产环境。第二种是在不同地域进行部署,如北京地域、上海地域以及杭州地域。

第二点,多环境保持一致。因为使用的是相同的模版进行部署,所有环境部署出来的结果都一样,这样可以避免人为错误,避免问题排查时的环境影响,环境造成的问题往往是最难排查的问题之一。

第三点,可审计。所有操作均通过 API,所有 API 操作都可以被审计,集成操作审计服务 ActionTrail 即可。

第四点是 DevOps。从环境部署到应用部署都模板化,版本管理使用 Git,可以做代码评审、代码回滚。

  • 资源编排 ROS 和运维编排 OOS

阿里云针对云上部署和运维特点,推出了两个产品,包括资源编排 ROS(Resource Orchestration Service)——解决自动化部署问题,运维编排 OOS(Operation Orchestration Service)——解决自动化运维问题。两款编排产品除了支持 ECS 的实例,还支持其它阿里云的产品,如负载均衡,关系型数据库 RDS,对象存储 OSS 等。

资源编排 ROS

  • 资源编排 ROS 的典型场景

资源编排 ROS 的典型场景主要有四种:

第一种是部署模版,资源编排 ROS 是通过模版方式达到可以重复部署的目的,使用模版可以在任何时间任何地点拉起一套环境。

第二种是 MSP、ISV 提供自己的部署模版,可以一键开出复杂的业务系统,如 SAP HANA 等系统,将部署时间缩短为几个小时。由于云上的环境都是标准的,只要有测试通过后的模版就可以在不同的环境、不同的账号中重复部署。

第三是解决方案中心,阿里云通过自身多年服务客户和双 11 的经验,总结了大量的最佳实践,在解决方案中心中提供了很多高质量的模版,支持开箱即用。

第四是 CI/CD 集成,在 DevOps 开发模式下,只有将部署模版放到 CI/CD 中才能打造 DevOps 的开发模式,轻松的做到蓝绿部署,并且支持阿里云云效。

  • ROS 控制台及操作演示

下图是资源编排 ROS 主页(https://rosnext.console.aliyun.com/),上方对 ROS 产品进行了简单的介绍;下方是常见的部署架构作为示例模版。

左侧菜单栏中有“我的模版”和“模版示例”,其中我的模版是需要自定义的模版,模版示例中提供了大量常见的部署形式,如 Jenkins、Kafka 等。解决方案中心中是由阿里云解决方案架构师团队、最佳实践团队、各业务方团队和资源编排团队合作共建,将阿里云多年沉淀的最佳实践和针对各种场景的解决方案沉淀为资编排源模版,用户可以使用这些最佳实践模版使得云上部署更加安全高效。

“资源类型”模块中展示了 ROS 支持的阿里云云产品。

下面以构建我的模版 LNMP-deom-1 作为例子,模版以 JSON 格式表达,也支持 YAML 格式,最重要的是,还提供了可视化的架构图。

可以发现所有的资源都在 VPC 内部,包括关系型数据库 RDS 和 ECS 实例。图中两个 ECS 实例挂在负载均衡 LoadBalance 下面。

接着可以使用此模版创建资源栈,之后通过事件 tab 知道每一步创建步骤。在资源 tab 中看到所有被模版创建的资源,只需要点击资源 ID,就可以打开实例详情页面。在输出 tab 在有显示一个网站链接,可以发现此次网站部署成功。参数 tab 中提供了每次模版的参数。当用户手动修改一些资源,与模版出现不一致时,可以使用检查资源偏差查看不同点。

运维编排 OOS

  • 运维编排 OOS 的典型场景

运维编排 OOS 的典型场景同样分为四种:

首先是批量操作实例和执行远程命令,例如启动、停止等,相比于其它方式无需密码,无需登录,无需使用跳板机,且无需担心安全问题,运维编排使用了阿里云 RAM 进行控制。

第二种场景是定时运维,在固定的时间执行制定的命令,相当于云上 Cron 服务,并且免托管,分布式。

第三种场景是支持报警和事件驱动运维,当某个事件发生时自动触发告警任务。

第四是提供大量丰富的公共模版,阿里云总结了大量的典型运维场景,并将总结成果开源到了 Github 上,欢迎大家贡献优质模版,共同打造运维社区。

  • OOS 控制台及操作演示

下图是运维编排 OOS 主页(https://oos.console.aliyun.com/),左侧菜单栏中有批量操作实例模块,任务类型包含发送进程命令、批量下载文件、实例操作、实例属性修改等。批量管理软件模块中可以批量的给实例下载和安装常见的软件,在我的软件模块可以自行部署和卸载

定时开关机模块中可以选择在指定的时间关闭、开启或重启实例。在包年包月的服务器情况下,客户需要在固定的时间升级临时宽带,等高峰过去后再下降,以达到节约成本的目的。在创建更新镜像模块中可以基于已有的实例进行更新,也可以基于已有的镜像创建实例,进一步更新,再创建新的镜像。

定时运维模块可以在固定的时间和固定的地域执行指定的任务。告警与事件运维模块中若控制台上显示当某个事件发生时自动触发模版,比如 CPU 使用率过高时重启实例操作。

所有的模版都提供了可视化视图,提供了更加直观的展示方式,还提供了 YAML 和 JSON 两种格式的文本,方便用版本管理软件如 Git 进行管理。

下图展示的是批量操作实例,发送远程命令,命令内容是发送输出命令。之后选择实例,可以手动选择,可以指定实例标题,也可以指定实例资源组,或者上传 csv 文件,从 ECS 实例表中导出 csv 文件来选择实例。

在高级选项部分可以配置执行模式,如出现错误时继续执行还是暂停实例,设置并发速率,允许的最大错误次数等。

此外还有更加快速的执行实例命令方式,在实例列表模块中选择具体的实例,进入实例详情页后会显示本实例远程命令,显示了历史的执行命令,同时可以发送新的远程命令。其次在实例列表中同时选择多台实例,选择更多,发送远程命令,这时多台实例就可以同时执行命令。

  • 使用 ROS、OOS 的部分阿里云产品

下图中列出了支持 ROS、OOS 的常见阿里云产品,包括 ACS 容器服务、FC 函数计算、SLS 日志服务、SMC 服务迁移中心等等,这与产品本身的部署场景契合。

云产品需要支持多种地域,阿里云有 22 个地域,使用 ROS 和 OSS 可以最大提高部署和运维效率。阿里云对内部系统变更有非常严格的要求,需要提供信息完整的变更单、申请、审批、以及需要为变更过程中可能出现的问题提前准备脚本。因此 OSS 会预先提供变更模版和回滚模版,从而提供自动化运维程度,降低人工错误。

客户对自动化运维有不同的需要,从下图左侧可以分出运维的几个层次,从最底层的手动运维、到半手工,半自动化运维、再到高度自动化运维、标准化运维以及智能运维(AIOps)、大部分客户的需求集中在中间三层,大部分的公司处于半手工,半自动化运维,异或高度自动化的方式,少部分的公司更加激进的走到了更加标准化运维,享受到了更加 DevOps 的方式,阿里云自动化部署 ROS 和自动化运维 OOS 的主打场景可以满足这三个主要层次的自动化需求。

今天的分享到此结束,感兴趣的同学可持续关注云上自动化部署 ROS 和运维 OOS 产品动态。

开源运维管理软件排名_云上自动化部署和运维的正确姿势相关推荐

  1. 云上自动化部署和运维的正确姿势

    凌云时刻 · 技术 导读:今天起,"凌云时刻"特别推出"阿里云玩转 ECS"系列课程,每周二.周四固定更新,欢迎关注.本期为系列第 1 讲,由阿里云资深技术专家 ...

  2. 开源运维管理软件排名_车主无忧:为什么放弃开源Kafka?

    简介:通过迁移到商业版本的 Kafka,车主无忧的系统稳定性得到了大幅提升,消息无丢失,生产与消费端的抖动明显好转,整个消息集群平稳运行,有效地支持了业务的快速发展. 车主无忧是属于广州小迈网络科技公 ...

  3. 开源运维管理软件排名_企业运维监控平台架构设计与实现(ganglia篇)

    一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简 ...

  4. 云智慧正式开源运维管理平台(OMP),加速AIOps社区生态建设

    近日,在云智慧推出数据可视化编排平台FlyFish后,又重磅推出开源运维管理平台OMP(Operation Management Platform).这款由云智慧自主设计与研发,集轻量级.聚合型.智能 ...

  5. 国内IT运维管理软件五大发展趋势

    国内IT运维管理软件五大发展趋势 ITIL/ISO20000国际标准.ITSM/ITIL软件(即IT运维管理软件.IT服务管理软件).及其所带来的IT管理水平的提升,越来越受到国内各类单位和机构的IT ...

  6. 传统网管软件与IT运维管理软件的区别

         很多朋友会有疑问,传统网管软件与IT运维管理软件的区别是什么呢? 下面我们通过对实际案例来分析,看传统网管软件与IT运维管理软件的区别在哪里. 某客户网络规模庞大,有200台左右网络设备,5 ...

  7. 运维管理软件中的精益思想

    精益思想,源于精益生产,用最少的成本获取最大的产出.精益思想,适合于各个行业和领域,是一种比较好的管理思想和品质. 由于信息化软硬件的规模不断扩大,数据信息的交互传递呈爆炸式增长,传统运维管理模式已无 ...

  8. NVisual-可视化运维管理软件在职业院校计算机网络教学中的应用

    随着国家新基建政策的引导,大批信息通信基础设施项目建设完成,那么后期的运维管理将需要大量技术维护人员.作为配套的人才建设,各大职业院校也都设立了计算机网络应用专业以培养相关人才.职业类院校计算机网络应 ...

  9. HostMonitor是一款功能强大的运维管理软件

    目录(?) [-] 工具介绍 部署 RMA配置 Window平台 Linux/Unix平台 远程Web管理 总结 1. 工具介绍 HostMonitor是一款功能强大的运维管理软件,可监控Window ...

最新文章

  1. java的基本数据类型有
  2. 剑桥大学创业基金和指导:Accelerate Cambridge
  3. 开源播放器 支持视频广告
  4. 3、数据库中的字符集和校对集
  5. 数据科学家常见的5个SQL面试问题
  6. BCD与ASCII码互转-C语言实现
  7. 张珺 2015/07/13 个人文档
  8. 6.go import
  9. 【leetcode】排序题(python)
  10. 解密中国网络游戏业的黑暗骑士:响尾马(下)
  11. Linux中缺32位运行库steam,Steam运行库修复工具 32位/64位 最新免费版
  12. 这可能是目前最好用的p2p外网访问内网软件(免费内网穿透)
  13. Undefined symbol main (referred from entry9a.o).
  14. CUDA 编程学习
  15. 刚读博一,她一作登上Nature子刊!
  16. Python中最快的搜索引擎之一:ThreadSearch(自己开发)(abccdee1)
  17. OpenCV Flann
  18. 【原创:C++编写库】自己的库
  19. tcam开发C语言,TCAM
  20. STC51入门笔记(郭天祥C语言)---第七节:l2C总线AT24C02芯片应用

热门文章

  1. 1)Java JDK和JRE
  2. 浅析MongoDB用户管理
  3. Matlab实用技巧
  4. 各种排序总结(三)堆排序
  5. python信号处理教程_PhysioNet生理信号处理(五)--WFDB for Python(DEMO)
  6. 从零开始学前端:复习课程 --- 今天你学习了吗?(CSS:Day11)
  7. Vue-在data中引入静态图片路径
  8. 07:有趣的跳跃【一维数组】
  9. Python并行判断多个大整数是否为素数
  10. 服务器怎么操作系统版本,服务器怎么操作系统版本