在传统企业正在积极拥抱“互联网+”,寻求IT转型之道的背景下,本文以太平洋保险DCOS成功迎战今年“春节全民抢红包”的实践为例,详细介绍了DCOS的核心技术以及这次实践效果,从而表明DCOS凭借其数据中心轻量级弹性伸缩能力为传统IT的敏捷转型提供了新机遇。

云计算驱动企业IT架构演进

随着云计算的快速普及,传统企业越来越关注基于云计算的下一代IT架构变革了。回顾企业IT架构演进历史,主要经历了“传统孤岛”、“x86+虚拟化”和“云化”这三个阶段。

最初的“传统孤岛”,软硬件堆栈各层间缺少统一的工业标准化,呈现出内聚与耦合的特征。随后的x86标准化带来计算、存储、网络、操作系统、中间件、应用层等多层次水平分工架构,为了提升IT灵活性和资源利用率,虚拟化开始在数据中心部署,IaaS实现了虚拟机级弹性伸缩,但IT基础设施扩张很快,系统层层堆叠,各层间集成交付的难度越来越大,同时,仅虚拟化也难以满足不断增加的业务对资源的变化需求。

于是企业开始期望将服务作为IT核心,提升业务敏捷性,同时大幅降低TCO,这时PaaS和应用资源池化实现了集群级弹性伸缩,很大程度上缓解了IT资源与业务发展之间的矛盾,让企业更专注于上层业务逻辑的运营。如果说IaaS属于云化的“初级”阶段,PaaS和应用资源池化就是云化的“进阶”阶段。而今天故事的主角DCOS实现了数据中心级弹性伸缩,使它称得上“深度”云化的发动机了。

回顾:DCOS是什么?

数据中心操作系统(Data Center Operating System,简称DCOS)是为整个数据中心提供分布式调度与协调功能,实现数据中心级弹性伸缩能力的软件堆栈,它将所有数据中心的资源当做一台大型计算机来调度,可以视作这个大型主机的操作系统。下表给出了Linux OS与DCOS(以基于Mesos为例)的类比:

太平洋保险DCOS平台关键技术选型

在今年春节期间,太平洋保险联合上海天玑数据,采用DCOS平台改造微信应用系统来支撑推出的“除夕夜摇红包”、“初五迎财神”等系列活动。活动期间DCOS轻松支撑高达每秒10万笔交易的业务高峰,仅除夕当夜微信增粉量就超过1300万。

这次太平洋保险进行综合评估技术选型后,最终选择了基于Mesos + Docker搭建DCOS平台。功能框架如下:以Docker为基础封装各类应用和运行环境,以Mesos、Marathon为核心实现容器资源的分布式调度与协调,以HAProxy、Etcd为辅助实现服务注册引流。

  1. 应用封装:Docker
    Docker为开源的应用容器引擎,在标准的LXC之上融合AUFS分层镜像管理机制,抛弃传统虚拟机试图模拟完整机器的思路,而是以应用为单元进行“集装封箱”,是轻量级的虚拟化技术。

Docker Engine可以自动化部署应用到可移植的的容器中,这些容器独立于硬件、语言、框架、打包系统。一个标准的Docker容器包含一个软件组件及其所有的依赖,包括二进制文件,库,配置文件,脚本等,实现持续集成与部署,快速迭代应用程序。

Docker容器可以封装任何有效负载,几乎可以在任何服务器之间进行一致性运行。开发者构建的应用只需一次构建即可多平台运行。运营人员只需配置他们的服务,即可运行所有应用。

  1. 资源调度: Mesos
    Mesos是为构建和运行其他分布式系统提供服务的分布式系统。它将CPU、内存、存储介质以及其它计算机资源从物理机或者虚拟机中抽象出来,构建支持容错和弹性的分布式系统,并提供高效的运行能力。

Mesos以Framework(框架)的形式,提供了“两级调度机制”,将任务的调度和执行分离。

Mesos Master负责将资源分配给各个框架,而各个框架的Scheduler进一步将资源分配给其内部的各个应用程序。

Mesos能和不同类型的Framework或Application通信,每种Framework或Application由相应的应用集群管理。

Mesos Slave的Executor具备调用Docker能力,当 Executor接收到Task时启动Docker,其可以调用Docker去启动一个容器。

3. 任务调度: Marathon
Marathon是基于Mesos来做任务调度,Mesos仅负责分布式集群资源分配,不负责任务调度。

Mesos集群可以混合运行来自Marathon的不同类型的任务。

Marathon基于Mesos的任务调度为动态调度,即每个任务在执行之前是不知道将在哪一台服务器上执行和绑定哪一个端口。

下图为Marathon执行任务调度示意图。9台服务器(灰色)组成的Mesos集群上混合运行各种Marathon调度的任务,其中一台服务器坏掉以后,这台服务器上的任务就受影响,Marathon可把任务迁移到其他服务器上,实现容错。

4. 服务注册与引流: HAProxy + Etcd
HAProxy提供高可用、负载均衡的解决方案,而Etcd是一个高可用的键值存储系统,主要用于共享配置和服务发现,提供了数据TTL失效、数据改变监视、多值、目录监听、分布式锁原子操作等功能,可以方便的跟踪并管理集群节点的状态。 Etcd与HAProxy配合能够实现数据中心应用的动态引流。

太平洋保险DCOS“春节红包活动”实践

为应对这次春节红包活动业务系统的瞬时高峰压力,太平洋保险DCOS平台采用223个主机节点,其中平台部分由5个节点构成Mesos Master Cluster,80个节点构成HAProxy Cluster,138个计算节点承载674个Docker Container,其中动态计算节点113个,静态计算节点25个。该平台可在1分钟内轻松实现扩展到1000个以上Docker节点。

DCOS的实战威力

  1. 巧妙分离动静态资源池,大幅提升应用访问速度
    考虑到互联网应用中会使用大量图片和动画等静态资源,为提高服务访问速度,该DCOS架构通过动静分离,将静态资源服务器和动态资源服务器池化并分开管理(分别放置在DMZ-WEB区和DMZ-APP区,前者放置静态资源池,后者放置动态资源池,见上图)。于是,静态资源请求可直接通过静态资源池完成,不必再访问后端动态资源池,减少动态资源池的压力。而且采用专门的静态资源服务器,具备Cache能力,可大幅提升静态资源的访问速度。

  2. 简化网络复杂度,提高网络访问速度
    太保原架构DMZ-WEB区的请求在穿过防火墙后需再经过DMZ-APP区的一个F5设备和HAProxy才能到达动态资源服务器,这样就多增了两层网络服务器的访问,降低访问速度,当然故障点也增多了。而改造后的架构,将动态资源池的路由信息同步到DMZ-WEB区的HAProxy中,HAProxy根据路由信息将动态请求直接转发到动态资源池上,从而极大简化网络路径的复杂度,网络访问速度明显提升。

  3. 超强弹性伸缩、快速持续集成
    此次除夕微信红包与初五抽奖活动间隔时间紧,若采用繁琐耗时的传统部署方法——得经过主机、操作系统、中间件、数据库和应用的集成部署,还得经过一定调试后才能对外提供服务。而改造后的DCOS通过与容器技术的深度结合,实现超强弹性伸缩,快速响应、持续交付,仅在10分钟内就完成共享资源的全部调整,有力保障业务的连续。

  4. 更细粒度资源调度,实现高资源利用率
    DCOS相较于虚拟机管理,有着基于CPU、内存的更细粒度的资源调度,多个计算框架或应用程序可共享资源和数据,大幅提升资源利用率,根据统计DCOS资源消耗可以节省50%。

    1. 高效的跨数据中心的资源调度
      DCOS平台展现了其在线性动态扩展、异地资源调度等方面的优异性能,1分钟内快速扩展到1000+的容器(如果应用更轻量启动速度还可以更快),平台和计算节点完全跨机房分布式调度。
  5. 分布式架构保障高可用
    DCOS平台所有组件采用分布式架构,应用跨机房分布式调度。自动为宕机服务器上运行的节点重新分配资源并调度,保障业务不间断,做到故障自愈。

结束语

总之,传统企业在“互联网+”的背景下,IT基础架构的发展要确保新技术的研究和应用与企业未来业务发展需要相一致。而今,云计算相关技术正在逐渐演化成熟,尤其PaaS领域的技术发展更是日新月异。以DCOS为代表的下一代轻量级PaaS正越来越为业内所关注。DCOS凭借其数据中心级弹性伸缩能力、快速持续集成等轻量优势,帮助企业快速应对业务需求,为传统IT的敏捷转型提供了新机遇。

本文作者介绍
胡罡
现担任中国太平洋保险集团股份有限公司信息技术中心应用运行支持部副总经理。长期从事保险行业信息化建设,曾多次主持大型保险信息系统建设和推广工作,参与和实施保险核心系统数据大集中和重构工作,参与大型数据中心建设和系统搬迁,参与智能移动保险平台建设。目前主要从事云计算和大数据相关技术研究和应用,面对移动互联浪潮的挑战和机遇,积极探索和实践传统行业IT运维模式的转型升级。

黄超
现担任中国太平洋保险集团股份有限公司信息技术中心需求规划与项目管理部资深IT架构师。2004年起在互联网行业从事互联网系统开发工作,中国最早一批进行互联网移动应用开发的IT人员,曾参与数款国内知名高并发大型互联网应用项目全程开发和架构设计。2009年起在太平洋保险就职,主要从事互联网项目,云平台和大数据相关技术研究和架构设计,结合自身互联网和金融行业的经验在互联网浪潮的改革中进行积极研究和探索。

从太平洋保险DCOS实践看传统企业的魅力变革相关推荐

  1. 从太平洋保险DCOS实践看企业IT架构演变

    ZD至顶网服务器频道 03月23日 新闻消息: 随着云计算的快速普及,传统企业越来越关注基于云计算的下一代IT架构变革了.回顾企业IT架构演进历史,主要经历了"传统孤岛".&quo ...

  2. 从阿里巴巴B2B的技术实践看互联网企业如何提升研发效能

    DT时代,企业业务已全面互联网化,而流程复杂.项目周期长.各角色协作成本大的传统研发模式,已逐渐成为企业业务快速发展的绊脚石.如果企业可以在业务需求不断变化的情况下,快速的推进业务上线,接受市场和用户 ...

  3. 从X240电脑看传统企业的创新陷阱

    您如在用X240,读此文可能会感同身受,如果没用甚至不知道是啥,也没关系,俺会很俗的跟您娓娓道来.但本文还是想借此谈传统的企业的创新陷阱,而不是作为一名X240的用户在这光抱怨这个必煞器. X240简 ...

  4. 君智咨询:从飞贷看传统企业如何转型移动互联网

    导语 移动互联网大潮来势汹汹,据预测数据显示, 2015年中国移动互联网用户规模达到7.9亿人,预计到2018年规模将达到8.9亿人.移动互联网俨然已成为当今主流消费人群的生活方式,它所带来的颠覆让众 ...

  5. 微信红包“昙花一现”?看传统企业中兴如何玩转“微信红包”

    春节期间,微信红包红了."拜年你就发红包"这种病毒式营销,让大家乐乐呵呵就把腾讯微信红包记在心里.现在年味淡了,微信红包不仅没有昙花一现,反而被部分嗅觉灵敏的企业移用,继续红红火火 ...

  6. 【物联网】物联网时代,传统企业终会夺回自己的天下!

    资料来源:IBM 作者:iot101君 物联网智库 原创 转载请注明来源和出处 ------   [导读]   ------ 互联网重构商业世界的趋势似乎无法阻挡--百度干了广告的事儿,淘宝干了超市的 ...

  7. 传统企业的移动电商平台实践

    本文首发在 freshmanTechnology .感谢中生代的邀请,也就促成了本文. 作者 郝振明 摘要:随着电商领域在传统企业的热度不断上升,在"互联网+"的背景下,许多传统企 ...

  8. 活动实录丨SRE在传统企业中的落地实践

    王璞/数人云创始人&CEO 美国George Mason 大学计算机博士.曾先后供职于 Google.Groupon 和 StumbleUpon等硅谷互联网公司.擅长分布式计算.大规模机器学习 ...

  9. app做好后如何上线_传统企业如何做好线上线下全网营销?不知道的建议看完这篇干货...

    传统营销在网络时代遇到了各种冲突,是企业停滞发展的原因之一.目前在中国,懂网络营销的好多都是IT派,缺乏传统营销经验.而传统企业因为观念落后和人才匮乏,又无法用网络营销思维做网络营销.今天,我们告诉你 ...

最新文章

  1. 港口物流系统设计与优化-SMU在线学习笔记
  2. python查询字典里的多个key_Python:如何快速找到多个字典中的公共键(key)
  3. python3随笔-梯度下降法
  4. R语言观察日志(part6)--初识rMarkdown
  5. mysql native数据同步_记一次MySQL(5.7版本)数据库的主从同步和备份
  6. Linux系统编程:fork函数的使用【循环创建N个子线程】
  7. icpc西部区域赛_信息学子在ACMICPC 2020中国(西部)大学生程序设计竞赛中喜获佳绩...
  8. java 用 jxl poi 进行excel 解析 *** 最爱那水货
  9. 中小企业集群ntpd服务搭建
  10. 计算机资格考试中级工程师种类,中级工程师职称考试类别及注意事项
  11. 鼠绘漫画 for wp8.1
  12. 预科阶段:快速实战入门
  13. 王佩丰VBA学习笔记
  14. 漫话:如何给女朋友解释什么是撞库、脱库和洗库?
  15. 【Trick】调优方法warmup
  16. iOS 开发的一些奇巧淫技
  17. 七尺男惨遭毒手变侏儒 痴情女真情不变仍同居
  18. 泰坦尼克号预测python_kaggle:泰坦尼克号获救预测_Titanic_EDA##
  19. 马克思主义与社会科学方法论
  20. 【迅速解决出现蓝屏代码0X0000007b的问题】

热门文章

  1. MySQL 到 MongoDB 实时数据同步实操分享
  2. Flink教程(04)- Flink入门案例
  3. 【大数据Flink系列】Flink教程:详细全部
  4. 场地测量的方法和程序_(完整版)场地平整施工测量
  5. 怎样共享windows和linux之间的文件
  6. 手把手教你打造一个排队叫号系统
  7. 搜索引擎优化系统知名乐云seo_搜索引擎优化策略分析-乐云SEO
  8. linux配置supervisor
  9. 【正点原子FPGA连载】第十五章 IP核之FIFO实验 -摘自【正点原子】领航者ZYNQ之FPGA开发指南_V2.0
  10. FVD跟驰模型Python数值仿真