在 2021 云上架构与运维峰会举办之际,InfoQ 采访了阿里云资深技术专家、弹性计算管控平台技术负责人田涛涛。

近几年,数字化转型带来了更加复杂的 IT 基础设施和大量的业务系统,对企业自身的运维能力来说,是一场前所未有的大考。DevOps 出现以后,极大程度地提升了企业的研发效率,缩短了业务从研发到上线的周期。在相近时间诞生的云计算,其所拥有的“软件定义一切”的特性,更是与 DevOps、智能运维和基础设施即代码(Iac) 等自动化运维趋势相互促进。

然而,将传统的 DevOps 直接搬到云上,是否真正地释放了云的优势?企业到底应该如何“用好云、管好云”?

带着这些问题,InfoQ 在 2021 云上架构与运维峰会举办之际,采访了阿里云弹性计算管控平台技术负责人田涛涛。

云时代,运维不重要了?

云时代到来以后,运维的门槛被大幅降低。传统运维需要处理服务器、网络等硬件设备,而在云时代,运维工程师不再需要直接操作实体资源,负载均衡、动态伸缩、数据迁移等服务全部可以交由云平台厂商来提供。

因此,与“去运维”相关的言论甚嚣尘上,不少人认为运维岗位会逐渐走向消亡,但事实是否真的如此?

“云时代的运维,变得比以前更加迫切、更加重要。”田涛涛认为,运维不是消亡,而是需要进化,因为云原生趋势的到来,给运维提出了更多挑战。

  • 第一,敏捷快速的交付方式给运维和交付带来了巨大的挑战。早前,研发团队交付一款 App 是按照半年时间进行规划的。如今,App
    从研发、交付再到上线,整个过程仅需要7 天。这样一来,高效地进行运维管理成为了云上运维必须思考的问题。
  • 第二,排查问题的难度持续飙升。无论是传统设备还是智能化设备,服务化都是大家关注的焦点,但做到服务化之后,系统之间的耦合会使调用关系变得复杂,一旦出现问题,它的影响面非常不可控。如何能快速做好可靠性、可用性观测、问题排查以及问题诊断,同样成为了云上运维的重大挑战。
  • 第三,在线系统数量变多,宕机影响变大。由于在线系统的数量越来越多,出现问题之后影响面是非常大的,甚至可能影响民生的工程。

不仅如此,云上运维的范畴也比以往更加广泛,运维人员需要关注蓝图规划、上云交付以及云上管理整个过程。我们能够清晰地感知到,身处新技术革命浪潮下,企业想要抢占市场,做好云上运维是非常重要的一环。

多数企业未发挥出云端 DevOps 潜力

几乎所有企业都十分认可公有云带来的产品和服务能力,并且大部分企业已经在公有云中使用了 DevOps,打通了开发与运维之间的壁垒,让团队从业务需求出发,向一个共同的目标前进。但将传统的 DevOps 直接搬到云上,又能否获得 1+1 等于或者大于 2 的收益呢?

答案是否定的。虽然云厂商屏蔽了底层的基础设施,让开发人员无需关注底层资源,使得很多企业认为上云其实是一件容易的事情。但实际上,云本身是一个非常复杂的操作系统,很多企业在传统线下没有自动化的基础设施工具。因此在田涛涛看来,企业没有转变观念、没有把云原生运维工具用好,是阻碍其充分发挥云端 DevOps 优势的一个重要原因。

根据 Puppt 2021 年度运维报告显示,只有 20% 的企业认为自己充分发挥了云端 DevOps 的潜力。云上自动化运维的模式和思维与传统 DevOps 相比,仍然有着不小差异。这也是部分企业上云之后,建立一套云原生自动化运维体系的挑战。

首先,传统企业上云之后需要意识到,操作的主体会从操作资产变成了对可编程的资源。这个转变是非常重要的过程:传统运维模式操作的都是企业的资产,需要充分压榨提升单机的利用率和使用率,并需要提前很久规划资源;而云端运维天然就有弹性的属性,除了提升单机利用率,还可以 On-demand 地获取资源和释放,同时云平台把一切都变成了可编程的资源,通过开放 OpenAPI 和应用分组来让用户管控资源。

其次,云上运维对安全可审计的要求更高。云端操作会高频切换很多自动化的任务,操作来源和对象相对复杂,对操作审计和操作来源和报警的时效性要求比较高;云端提供的服务可以将服务通过一条命令直接暴露在公网之中,需要更多的设计和思考安全和网络规划能力来降低系统风险;高频的可编程自动化运维需要有比较好的审计和问题追踪能力,避免越权和不容易被追踪的问题。

此外,这几年自助服务已经成为很多企业的追求目标。在云上,很多企业都把自己的产品,通过服务的形式暴露给更多的客户,所以对于系统的可靠性有着更高的要求。

CloudOps 应运而生

“企业想要寻找到一名优秀的 DevOps 工程师,其成本是非常高的。”田涛涛说。

为此,阿里云为企业带来的破局思路是:帮助企业理解云上运维,并为处于不同阶段的企业推荐不同的功能,进而简化他们的学习门槛,提高使用云原生运维工具的便捷度。

在 2021 云上架构与运维峰会中,阿里云在业界首发了云上自动化运维(CloudOps)白皮书,定义并系统性阐释了一个新的词汇——CloudOps,着重强调如何在云平台上更好地践行 DevOps。同时,田涛涛也在会上发表了《CloudOps :自动化运维的新思路》的主题演讲。

据他介绍,CloudOps 作为传统 IT 运维和 DevOps 的延展,可以通过云原生架构实现运维的再进化,充分帮助企业降低 IT 运维成本、提升交付速度和系统灵活敏捷度、增强系统可靠性,构建更加安全可信开放的业务平台。在 CloudOps 白皮书中还强调了一点,CloudOps 不等于单纯的 Cloud+DevOps 或者 DevOpsonCloud,而需要将 DevOps 和云有机结合,才能收获更大价值。
此外,田涛涛在演讲时提到:“云上运维是一个从简单到复杂、从成长到成熟的管理过程。”企业根据不同的上云状态以及使用规模,其云上运维的思路都不尽相同,并且随着业务不断发展,运维的思路也日益复杂。创业公司从第一天开始就可以在云上部署其生产环境服务客户,而对于已经存在 IT 投入的公司来说,则需要花费更长的时间逐步上云。

但可以肯定的是,无论企业身处哪种场景,其运维需求都会持续存在:降低成本、提高效率是企业追求的核心目标。因此,有效地规划和制定运维策略和方法非常重要。阿里云在 CloudOps 白皮书中提出了成熟度模型——CARES,分为自动化能力、弹性能力、高可用能力、安全和合规能力以及成本资源量化管理五个维度进行衡量,帮助企业判断自己所处的阶段,也为处于不同阶段的企业提供运维策略参考与优化方向。

简化路径,让云上运维更简单

对于企业来说,如何能够高效地交付应用已成为了业界的共识,这就要求企业需要通过自动化、自主化的策略高效工作。对于一名研发人员来说,他们最头痛的问题就是在基础设施和应用之间来回切换、适配。

为了让企业在运维阶段更省心,田涛涛还在峰会中同步了 ECS 自动化运维套件的全新升级,包括服务器迁移中心、资源编排、运维编排等 15 个工具,可以帮助企业实现从 IT 架构的规划、迁移、部署、弹性扩缩容到日常管理,覆盖云基础设施全生命周期的自动化运维。

本次 ECS 自动化运维套件推出了新产品——应用管理 Application Manager,不同于从前的资源视角,应用管理支持从应用视角监控、管理和运维基础资源,实现更精细化的管理,并与阿里云 DevOps 平台云效集成,支持一键完成从代码编译构建到部署的全生命周期。

在接受采访时,田涛涛表示:“基于用户在使用 ECS 过程中反馈的常见工单,我们建了一个集群模型来帮助用户快速定义、诊断错误的链路,这就是我们的智能诊断服务。之前系统出现问题时,企业需要花几个小时拉人、拉群去解决,但通过自助化服务的工具,可以做到秒级或者分钟级就把问题解决掉。”

和智能问答、智能机器人一样,ECS 的升级思路也是优先帮助用户解决问题。正如田涛涛在演讲结束时提到的那样:未来,传统的运维需要进化到新的思路,企业应该更少地关注基础设施和基础资源,更多地回归到应用本身,让企业运维视角与云平台的运维视角紧紧贴合。
企业如何用好云、管好云?

企业如何用好云、管好云?相关推荐

  1. 31 家企业入选阿里云首期云原生加速器,共建云原生行业新生态

    产业数字化浪潮中,云原生已成大势.3 月 9 日消息,阿里云宣布袋鼠云.谐云.黑湖科技.骞云科技等 31 家企业入选阿里云首期云原生加速器,其中超半数企业为 B 轮及以上融资,1/5 企业为 C 轮及 ...

  2. RSA 2019安全大会:企业资产管理成行业新风向标,云上安全占优势

    美国时间3月4-8日,国际知名信息安全峰会RSA Conference在美国旧金山开幕,云安全及云可以为企业提供更可靠的资产管理方式成为大会热点. 此次峰会共吸引全球700多家机构参展,其中近42%为 ...

  3. 企业的最佳选择?开放式混合云大行其道

    本文讲的是企业的最佳选择?开放式混合云大行其道,从概念的提出,到被业界关注热炒,再到真正的化云为雨落地生花,对于企业决策者来说,云计算已不再是一项新技术,而是一项新的选择.2013年,企业需要把云运营 ...

  4. RSA 2019安全大会:企业资产管理成行业新风向标,云上安全占绝对优势...

    美国时间3月4-8日,国际知名信息安全峰会RSA Conference在美国旧金山举行,云安全.及云可以为企业提供更可靠的资产管理方式成为大会热点. 此次峰会共吸引全球700多家机构参展,其中近42% ...

  5. 亚马逊云科技发布“云拓计划”赋能企业加速上云及数字化转型

    亚马逊云科技"云拓计划(SkillsGuild)"于1月11日正式发布.该项目是一个旨在帮助客户的员工提升云技能.加速企业上云的赋能计划.它通过为企业量身定制综合性云技能提升方案, ...

  6. 读取文件云服务器bcc,云服务器bcc如何用

    云服务器bcc如何用 内容精选 换一换 当云服务器网络异常.防火墙未放行本地远程桌面端口.云服务器CPU负载过高等场景均可能导致云服务器无法正常登录.当您的云服务器无法远程登录时,我们建议您首先检查是 ...

  7. 有赞和腾讯云、阿里云一同摘得“中国企业云科技服务商50强”

    互联网时代的每一次技术变革都带来新的机会,而云计算这一诞生于2006年的新技术正在引领新的科技浪潮.正是从2006年开始,众多云计算公司借助云计算的东风,成长为数十亿.上百亿甚至超千亿美元市值的科技公 ...

  8. 【Kubernetes 企业项目实战】05、基于云原生分布式存储 Ceph 实现 K8s 数据持久化(下)

    目录 一.K8s 对接 ceph rbd 实现数据持久化 1.1 k8s 安装 ceph 1.2 创建 pod 挂载 ceph rbd 二.基于 ceph rbd 生成 pv 2.1 创建 ceph- ...

  9. 企业混合多云“芯”体验,上云、用数、赋智“组合拳”

    导读:前不久,发改委和中央网信办联合发文<关于推进"上云用数赋智"行动 培育新经济发展实施方案>,其中"上云"."用数".&qu ...

  10. 如何通过企业微信便捷访问华为云、阿里云?

    如何通过企业微信便捷访问华为云.阿里云? 随着云计算.移动办公在企业.政府中的广泛应用,应用管理员及应用开发者对华为云.腾讯云.阿里云等云服务的使用日益频繁.各云服务厂商的平台通常需使用用户名口令,或 ...

最新文章

  1. findclass java_Java Context.findClass方法代码示例
  2. pyinstaller3.5 和 python 3.8 不兼容
  3. 当你「ping 一下」的时候,你知道它背后的逻辑吗?
  4. interrupt()会中断线程的wait等待
  5. 实战演练:MySQL手动注册binlog文件造成主从同步异常
  6. CREATE VIEW SQL:通过SQL Server中的视图插入数据
  7. Thinkphp5中利用js/jQuery传递参数的方法
  8. pivot 与 unpivot函数
  9. 牛腩新闻发布系统—发布网站
  10. 微信扫一扫登录(使用小程序实现)
  11. CE教程:植物大战僵尸(太阳数值修改)
  12. 解决AudioCont...HTMLMediaElement already connected previously to a different MediaElementSourceNode.问题
  13. 单反相机的传奇—佳能单反50年辉煌之路(连载十四)
  14. 数字功放音质好不好?从哪些地方看
  15. Java8 ,LocalDate,LocalDateTime处理日期和时间工具类,
  16. MySQL版 emp 数据库
  17. Crypto如何塑造数字革命 |链捕手
  18. 数学建模 线性规划报告_2019年高中数学新教材正式发布!变化明细首次曝光!...
  19. GitHub vs.Bitbucket:不仅仅是功能
  20. window的pip命令

热门文章

  1. 最短路径顶点算法:最短路径之迪杰斯特拉(Dijkstra)算法Strut2教程-java教程
  2. MySQL-第五篇视图
  3. 在vue中后台返回的文本包含标签时候解析为html代码
  4. multiprocessing模块
  5. Apache Shiro(六)-基于URL配置权限
  6. P1879 [USACO06NOV]玉米田Corn Fields
  7. TI C6000 数据存储处理与性能优化
  8. CAS SSO 单点登录实例
  9. [knowledge][lisp] lisp与AI
  10. Hololens2的调试与安装