为了分享过去一年云原生产业联盟(CNIA)在标准建设、评估测试、技术研究、实践合作等方面的工作成果、探索行业最新趋势动态,云原生产业联盟于2023年1月9日举办了2022年度线上年会,发布了“大数据云原生能力成熟度模型”,并进行了标准解读。

云原生时代,数据系统的技术架构正在多样化用户需求的驱动下快速演进。容器、Serverless、CI/CD、Kubernetes等云原生技术与大数据系统的深度融合,可以有效应对海量、异构、实时的用户数据处理请求。充分利用云原生平台能力实现大数据系统的“云原生”转型升级,已成为行业公认的重要发展趋势。

在此背景下,中国信通院与腾讯云牵头,联合火山引擎、中国电子、东软集团、众安科技、信华信、新华三等单位,经过多轮研讨,形成了《云原生能力成熟度模型 第6部分:大数据平台》。

模型涵盖基础设施、平台研发、应用服务3个能力域,9个过程域,34个能力子项,从资源管理、资源弹性、编排调度、集成兼容、应用管理等方面评估大数据平台的云原生成熟度等级,结果细分为:基础级、全面级、优秀级。

在2023年1月9日举办的2022年度云原生产业联盟年会上,来自腾讯的高级工程师胡子千和火山引擎的云原生计算资深产品专家王磊分别进行了云原生大数据主题分享。

胡子千老师在分享中提到:大数据现存的问题和痛点在于其过于庞大和复杂的架构、繁杂的运维工作、无法共享资源池造成的高昂成本,以及在Hadoop体系下多租户隔离问题。云原生的优势在于降低资源、运维及技术成本、提升大数据服务的交付效率、提升大数据可用性、并且可以结合AI技术,帮助大数据营造良好的云原生的生态。

现阶段,云原生组件大多是随着在线需求成长起来的,在线服务的云原生进度相对更加成熟,而对大数据业务的支撑需要持续完善。大数据的应用特点与在线的应用特点存在运行时间、调度吞吐量、资源弹性、业务延迟、存算分离几个方面的不同。这也导致了在弹性调度、超大规模、高吞吐、存算分离、引擎改造等方面挑战的产生。

腾讯大数据团队基于云原生生态,打造了以存储编排、大数据运行时、混部、统一任务调度、云原生引擎组成的云原生架构,通过构建统一数据编排、虚拟集群架构,remote shuffle 等能力解决大数据云原生化中遇到的存算分离、资源弹性等问题。同时通过大数据运行时能力、在离线混部能力进一步挖掘大数据云原生化的价值,为业务提供低成本、高效、稳定的大数据服务。

腾讯云大数据源自腾讯内部海量业务的打磨与积累,经过十几年发展到如今的以“云原生、隐私计算和数智融合”为代表的第四代大数据平台。腾讯云大数据的全栈产品矩阵都在向云原生演进:弹性MapReduce容器版于22年7月已开放公测,提供大数据组件完全基于容器服务部署的新体验;22年12月刚推出了CDW-Clickhouse云原生弹性版,采用全新存算分离架构,自研表引擎,提升产品性能的同时降低投入成本,腾讯云ES也上线了云原生版,通过存算分离实现秒级弹性伸缩,承载更强的读写高峰,快速适应业务发展,去除存储/计算冗余从而使成本降低40%。

王磊老师在分享中提到,大数据平台在云原生化后,从部署运维、资源调度、存储介质三个维度体现出了明显优势。

在部署运维方面,传统应用服务需要人工部署在裸金属或云主机上,部署流程低效,监控告警也需要对不同服务器节点进行监控配置和维护;云原生化之后,只需要一键部署,服务迅速拉起且天然支持高可用,运维监控只需要聚焦在统一的基础设施 K8s 集群即可。

在资源调度方面,传统架构需要单独准备服务器资源,业务高峰情况下的扩容需求只能通过提前预留的机器资源进行准备;云原生化之后,流式、批式、搜索引擎、消息引擎等所有计算资源均可以统一在一个大的容器资源池内综合调度分配,响应迅速。

在存储介质方面,传统架构下服务器的存储介质均来源于挂载的硬盘,且各个服务之间有数据流转时,也依赖不同服务器之间的 IO 和网络带宽。在云原生化后,统一负载到具备HDFS文件系统协议的对象存储,以及具备缓存加速能力的文件存储服务,可以实现资源按需使用且无需人工扩容。在大数据 ETL场景下,数据流转均在大数据文件存储CFS内部进行,具备天然高效的磁盘IO和网络带宽。

火山引擎云原生大数据系统目前支撑着字节跳动集团内部各个业务线应用,主要架构可以总结为“三大平台(开放平台、引擎平台、调度平台),一大支撑体系(运维体系)”。其中,调度平台是云原生化后最为核心的平台,针对流式、离线、查询、批处理等不同用户场景,实现资源利用率提升、资源切换灵活、离线资源统一管理三方面价值,可以满足多云部署和调度需求,并通过虚拟队列进行全局的Quota管控,可以考虑机房负责情况、响应时间、成本等等多种负载因素,自动分发合适的机房/集群/队列,满足容灾需求。

后续,中国信通院将持续开展“云原生数据服务”相关评估和研究工作,发布云原生大数据研究报告,并更新“云原生产品目录2.0”,助力云原生技术发展和行业创新应用。

关注腾讯云大数据公众号

邀您探索数据的无限可能

点击阅读原文,直达大会主场馆

↓↓↓

大数据云原生能力成熟度模型,重磅发布!相关推荐

  1. TeaTalk·Online 演讲实录 | 圆满完结 大数据+云原生,再度风云起

    4月6日,TeaTalk· Online开源论道系列活动第2期--"论道云原生,且看大数据江湖"线上直播成功举办.本次直播从"从Hadoop到云原生".&quo ...

  2. 京东零售大数据云原生架构实践

    通常谈到大数据,想到的是大数据平台.Hadoop生态或者数据湖技术,关注于大数据存储.大数据计算方向上的技术发展与应用:谈到云原生,想到的是微服务架构.容器化或者SRE(Site Reliabilit ...

  3. 技术集锦 | 大数据云原生技术实战及最佳实践系列

    随着云平台.容器等技术的不断成熟,云原生大数据解决了传统大数据平台建设和运维中的繁琐,使即时可得,按需分配的高效大数据开发平台成为可能. 云原生的到来不止为大数据部署和交付带来了变革,它更是帮助大数据 ...

  4. TeaTalk·Online 大数据+云原生,再度风云起

    来源:安防展览网 大数据技术发展到今天已经有十多年的时间,如今大数据技术已经从新兴前沿技术逐渐成熟成为普惠性技术.同时现今云原生技术又在如火如荼的发展,那么大数据技术,尤其是基于Hadoop开源生态的 ...

  5. 【大数据云原生系列】大数据系统云原生渐进式演进最佳实践

    1.引言 随着云原生概念的兴起,越来越多的企业投身于云原生转型的浪潮,以解决传统应用面临的弹性能力不足.资源利用率较低.迭代周期较长等问题.通过云原生技术(如容器,不可变基础设施和声明式API等),使 ...

  6. 零信任能力成熟度模型白皮书发布!内附下载资源

    摘要:华为云重磅发布全球首个<华为云零信任能力成熟度模型白皮书>,向行业展示了华为云安全的新能力和新突破. 10月16-17日,2021"天府杯"国际网络安全大赛暨国际 ...

  7. 京东零售大数据云原生平台化实践

    分享嘉宾:吴维伟 京东 架构工程师 编辑整理:陈妃君 深圳大学 出品社区:DataFun 导读:随着业务调整和集群资源整合需求,大数据系统中集群数据迁移复杂混乱.本文将以京东大数据平台为例,介绍京东近 ...

  8. GOPS 2021 上海站 《钟炯恩 大数据云原生运维平台实践》

    https://github.com/alibaba/SREWorks

  9. 首批 | 腾讯云完成国内首个云原生安全成熟度评估

    历经多年发展,我国云原生技术生态已趋于完善.行业用户接纳度急速提升.资本市场热潮涌动,可以预见我国云原生产业即将进入高景气周期.在用户侧,全面转型云原生已是大势所趋,但云原生技术架构的重塑和应用模式的 ...

最新文章

  1. gitee提交代码_在Gitee获8.5k Star,做微信小程序商城看这一个开源项目就够了
  2. ASSERT(IsOpen());
  3. Anti-If: The missing patterns--转
  4. SAP请求传输事务代码
  5. Rating Methodology – Bank Loan / Facility Rating(CRISL)
  6. 游标 和 锁的概述
  7. js,在字符串中,查找某个字符的位置
  8. AndroidStudio开发环境安装及配置
  9. iSCSI远程块存储配置实验
  10. 浏览器 之 无头浏览器
  11. local class incompatible: stream classdesc serialVersionUID = -6230081990944906418, local class seri
  12. 微信第三方授权获取用户信息
  13. php手机接收验证码,乐信揭秘php手机接收短信验证码实现编程案例
  14. win8.1打开网络上的计算机没有权限,Win8无网络访问权限_Win8无internet访问权限怎么解决-192路由网...
  15. Cobalt Strike 提权
  16. h0131. 钞票 (15 分)
  17. js 手机号码和电话号码(座机号)正则校验
  18. Java软件测试工程师之学习进阶路线
  19. 小京东等产品后台版权及logo修改教程[ecshop二次开发]
  20. 关于uint与int

热门文章

  1. PHP调用ZPL斑马指令 打印二维码标签
  2. 你可能没注意的CSS单位 BY:色拉油啊油
  3. 四则运算java_小学生四则运算JAVA
  4. python 酷炫效果_六种酷炫Python运行进度条效果的实现代码
  5. 基于51单片机的ADC热敏电阻测温系统proteus仿真
  6. 千里马Android Framework-Binder通信总结流程图
  7. 什么是陀螺仪的dr算法_陀螺仪与加速传感器数据的融合算法解析
  8. 方向gravity_两种对齐方式,layout_gravity和gravity大不同
  9. 网上找到了一个电机正反转驱动电路,保留
  10. 用Arduino读取HX711应变片专用模块