【以下为分享实录,有删节】

今天分享的题目是《企业CICD规模化落地》,因此我们不会侧重讲解CICD是什么以及怎样做CICD,而是你已经知道怎样“玩转”CICD了,要如何在一个比较大的企业中规模化地落地。

研发流程与持续交付简析

持续交付是随着互联网的迅猛发展逐渐普及的一种研发模式,它具有“快速反馈”“质量内建”“自动化”“开发自运维”等特点。

这种研发模式主要包含如上图所示的四个环节,“分支管理”“测试验证”“制品管理”和“发布”。在业界有很多工具支持这些操作,在云效产品矩阵中也有对应的产品提供相应功能。

在一个中小型的研发团队(比如5-10人),无论你是使用商业软件还是开源的工具,经过一段时间的学习,你都可以把“持续交付”做起来。但是当需要规模化落地之后,就有更多的问题需要考虑,如:

  • 如何提高协作效率;
  • 新团队如何快速接入;
  • 如何进行全局风险的控制;
  • 研发流程如何全局更新。

持续交付在阿里巴巴的规模化

接下来简单了解一下“持续交付”研发工具在阿里巴巴内部的演化历程。2009年,我们开发了自动化发布工具;2013年,建立统一构建部署平台;到了2016年我们已经有了持续交付平台,内部称为“Aone”,该产品包含了从代码开发、构建、发布等功能,以一个一站式的研发平台,这个产品到现在也一直在演进;2017年时,我们将“Aone”的核心功能开放出来,供广大开发者使用,就是我们的“阿里云·云效”。目前该产品在公测中,大家可以登录阿里云官网进行访问、使用。

下面我们介绍几个帮助阿里巴巴实现持续交付规模化落地的研发实践。

要使持续交付规模化落地,很重要的一点是需要有一套工具对研发模式进行全自动支持。 “研发模式”是指你做事情的一种方式,在这里主要是指代码发布模式以及对应的分支使用方式,比如“主干模式”,这也是持续交付比较提倡的一种研发模式。但是“主干模式”对研发人员的要求比较高,并且也不能很好的体现出当前要进行发布的内容。作为一位研发负责人,你可能会选择更灵活一些的研发模式,比如 “Aone Flow”或者 “Git Flow”等,这两种模式都需要一定的自动化工具进行支持。

其中Aone Flow是在阿里巴巴内部主流的一种发布模式及分支管理方式,我们这里简单介绍一下,感兴趣的同学可以在网上搜索相关文章了解。Aone Flow使用三种分支类型:主干分支、特性分支、发布分支。主干分支上的代码跟线上版本的代码是一致的,当你要开发一个新的功能时,就会拉取一个特性分支作为开发分支,然后在这个分支上提交代码修改。当你需要发布的时候,需要先将不同的特性分支合并为开发分支再进行发布。发布到线上正式环境后,合并相应的发布分支到主干,在主干添加标签,同时删除该发布分支关联的特性分支。这个过程中涉及到大量的“拉分支”“合分支”“打标签”“回滚版本”等等复杂操作,这就需要有一系列自动化工具进行支持。在阿里巴巴内部我们是通过Aone平台(即云效的内部版本)提供自动化支持的。

第二个实践是以应用为核心的一站式研发体验。“应用”是指一个服务或者微服务,可以直接对应一个代码库。以应用为中心,我们又可以串联流水线、环境管理、构建配置、部署等工具链。可以让开发人员很好的理解和打通整个研发流程,同时也可以帮助一个新团队快速上手。

上图是我们内部一个产品研发过程的截图,会有一个研发向导帮助你提交各种信息、初始化代码库、源码自动生成、申请测试环境、进行线上发布等一系列操作。这种“以应用为核心的一站式体验”非常爽,可以帮助研发团队节省很多耗费在协作上的时间,而且有了这套流程之后,只要按照向导的提示去做就好了,很少出错。

接下来,我们聊一下如何进行全局风险管控。

在部署正式环境之前,会有一个Checklist,进行安全审核、PE审核等等,我们很多对外发布的应用都会经过这样的安全审核。在前DevOps时代(2016年以前),阿里巴巴内部还是有专门的运维团队的,我们叫PE团队。在正式发布前,他们会去审核发布的时间点、配置参数等。这就是全局风险管控,这些卡点会强制在一个流程中实施,不能够取消。(当然现在已经阿里巴巴内部已经取消了PE团队,这些卡点会通过自动化工具实现)

**兼具灵活性与规范性的持续交付平台
**
通过以上几个措施,就能够在阿里巴巴内部规模化的落地CICD,当新的研发团队加入时,也不用花费太多的时间去理解这个事情,而是很快上手去操作。但是我们这一套流程也遇到一些问题,这套流程面向Web端服务是可以很好去应对的,比如我们只有一个版本的“天猫”“淘宝”,永远是面向最新版去交付的;但是随着阿里云业务的发展,特别是出现了混合云的业务,出现了面向多Region和多版本交付的情况,我们这套研发流程就有点捉襟见肘了;因为我们的研发理念是“以应用为中心”,当遇到一些跟应用无关的交付场景时这套研发流程也会显得不合时宜。

如何提高阿里巴巴持续交付平台的灵活性呢?我们最早的研发架构如上图左侧所示,底层是研发平台,上面我们做了很多“场景化”的研发组件,同时保留了一定的扩展性,比如“自定义组件”,用户可以把自己的组件接入到我们的流水线里来;也暴露了一部分API,主要只读接口,其他团队可以在这上面做一些他的场景化。

我们认为这种研发架构的灵活性和扩展能力是不足的,(如上图右侧所示)后来我们就把构建、编排、部署、制品这些能力单独拎出来,并开放对应的API,上层我们再去编纂“场景化”,而且有可能这些“场景”都不是我们开发的,而是使用这个产品的用户自己去开发,重点是我们需要将这种扩展能力暴露出来。我们还会有“自定义步骤”和“自定义组件”,这两个功能已经在云效产品中提供。同时,我们还会开发更多API、支持更多的源,也可以通过配置webhook在流水线的生命周期中(失败、成功、暂停等)通知第三方。

这样的研发架构就具备了一定的灵活性和可扩展性,但对于企业来讲这是不够,还必须具有开箱即用的能力。

云效内置代码扫描、 安全扫描和各种自动化测试能力,并通过流水线模板串联起来 。如上图右侧所示,针对主流的开发语言Java、PHP、Node.js、Go、Python等提供从构建到部署发布的各种模板,可以帮助你快速开始。

模板化能力其实是推进CICD规模化落地的关键,云效不仅提供了数十种通用的模版来帮助你快速创建流水线,同时提供定制化能力,支持定制企业自有模版来管理企业持续集成和持续交付流程,将复杂的流程通过可视化编排和结果展现,保障交付可见可控可度量。

总结:

当你已经对CICD有一定了解,怎么样更好的在组织内规模化落地呢?第一,你需要选择一款兼具灵活性和规范性的工具平台。第二,制定适合自己企业的研发模式,并将其固化下来;第三,研发模式的变更可以应用到已有的团队;第四,通过适当的卡点来控制全局风险。

以上内容整理自怀虎的视频分享《企业CICD规模化落地》,欢迎大家加入云效开发者交流群(钉钉群号:34532418)观看视频回放,下载演讲PPT。


【关于云效】

云效,企业级一站式DevOps平台,源于阿里巴巴先进的研发理念和工程实践,致力于成为数字企业的研发效能引擎!云效提供从“需求 ->开发->测试->发布->运维->运营”端到端的在线协同服务和研发工具,通过人工智能、云原生技术的应用助力开发者提升研发效能,持续交付有效价值。

【云效官网】https://www.aliyun.com/product/yunxiao
【公测指南】https://developer.aliyun.com/article/756207
【申请公测】https://devops.aliyun.com
【学习路径】https://help.aliyun.com/document_detail/153739.html
【开发者社区】https://developer.aliyun.com/group/yunxiao
【精彩活动】云效公测开启 「产品体验官」招募中~
https://www.aliyun.com/activity/yunxiao/Beta2020

欢迎扫码加入云效开发者俱乐部(钉群:34532418)

原文链接
本文为云栖社区原创内容,未经允许不得转载。

分享实录 | 企业CICD规模化落地浅析相关推荐

  1. 直播预告 | 企业CICD规模化落地

    [直播主题]企业CICD规模化落地 [直播时间]2020年4月28日 16:00~17:00 [直播简介] 持续交付有很多的实践,比如自动化测试,交付流水线等.对于一个小团队来说,使用开源工具集合和一 ...

  2. AI规模化落地,英特尔至强的七重助力

    当今时代,各行各业与人工智能(AI)加速融合,通过智能化创新来寻求业务转型升级.与为数不多的顶级AI研发公司相比,大多数传统行业或企业有着更丰富的 AI 应用场景,推动着规模化的AI应用落地,其AI应 ...

  3. 深度 | 容器规模化落地企业的最佳途径

    随着云原生时代的发展,传统 IT 基础设施加速云化,云原生化成为云上的必然趋势.作为云原生代表技术之一,容器技术可帮助企业提升 IT 架构的敏捷性,加速应用创新,帮助企业更加灵活地应对商业发展中的不确 ...

  4. 活动实录丨SRE在传统企业中的落地实践

    王璞/数人云创始人&CEO 美国George Mason 大学计算机博士.曾先后供职于 Google.Groupon 和 StumbleUpon等硅谷互联网公司.擅长分布式计算.大规模机器学习 ...

  5. 柯基数据企业知识图谱落地案例分享

    从一开始的Google搜索,到现在的聊天机器人.大数据风控.智能医疗.自适应教育.推荐系统,无一不跟知识图谱相关.它在技术领域的热度也在逐年上升.本文通过分享企业知识图谱落地案例,以通俗易懂的方式来讲 ...

  6. 《AIOps在360的落地实践》分享实录

    女主宣言 随着运维工作从规模和复杂度多方面的爆炸式增长,传统的运维手段已经无法满足如今系统运维管理的需求.AI技术日趋成熟,智能运维(AIOps)应运而生,给运维行业带来了很多的变革和机会.如何将大数 ...

  7. 高德最佳实践:Serverless 规模化落地有哪些价值?

    来源 | 阿里巴巴云原生公众号 作者 | 何以然(以燃) 导读:曾经看上去很美.一直被观望的 Serverless,现已逐渐进入落地的阶段.今年的"十一出行节",高德在核心业务规模 ...

  8. 高德最佳实践:Serverless规模化落地有哪些价值?

    简介:曾经看上去很美.一直被观望的 Serverless,现已逐渐进入落地的阶段.今年的"十一出行节",高德在核心业务规模化落地 Serverless,由 Serverless 支 ...

  9. 云计算与 Cloud Native | 数人云CEO王璞@KVM分享实录

    今天小数又给大家带来一篇干货满满的分享--来自KVM社区线上群分享的实录,分享嘉宾是数人云CEO王璞,题目是<云计算与 Cloud Native>.这是数人云在KVM社区群分享的第一弹,之 ...

最新文章

  1. [云炬看世界]个人站长
  2. Python学习—基础数据结构之列表
  3. Linux 命令之 curl 的选项(英文版)
  4. .Net Core 学习资料
  5. Qt工作笔记-动态曲线图
  6. gcc预处理、编译、汇编、链接详解
  7. 在虚拟机中安装红旗桌面7.0 Linux操作系统的详细图文教程
  8. Java并发(六)——CAS、AQS、Lock、通信工具类
  9. 【leetcode】心得
  10. vs2010+silverlight4 error
  11. 中国裁判文书网接口解密
  12. 除了秃顶,你和程序员大佬还有啥区别?
  13. MySQL忘记密码如何重置
  14. 职业生涯规划计算机专业中职生3000字,计算机专业职业生涯规划书范文格式3000字...
  15. Tab切换 排斥 asyncData
  16. SQL Server拼接字符串执行语句,引号中加引号。
  17. Win7 x64 修复IIS安装失败记录
  18. 利用Python实现自动扫雷小脚本
  19. 视频教程-PHP快速入门视频课程(通俗易懂)【2019版】-PHP
  20. 系统时间显示到秒-Windows10

热门文章

  1. php怎样查看视频播放的进度条,H5中视频与音频标签和进度条如何使用
  2. mysql load data outfile_mysql load data infile和into outfile的常规用法:
  3. linux lvm lv扩充--虚拟机,虚拟机新增磁盘后lvm下的lv扩容
  4. 连接硬盘计算机没显示,新买的移动硬盘在我的电脑中无法显示,但是右下角图标显示已经连接,? 爱问知识人...
  5. java 数据字典 spring_springboot+redis+切面实现数据字典功能
  6. vs工程 更换opencv版本_Windows下opencv源代码转化和编译
  7. php输入安全验证漏洞,PHP 输入验证错误漏洞
  8. dhcp工具_网络分析之DHCP服务闯入QinQ二层隧道引发故障
  9. 一个程序员的水平能差到什么程度
  10. 人工智能时代来临,还需要那么多人吗?