大数据的需求热度,从来都是这个时代的浪尖。然而由于大数据系统的复杂性,一度导致业界大数据已死的各种声音不断。尤其是当MapR被HPE收购,Cloudera公司股票持续跌成狗,使得这种声音进一步放大。

其实,大数据的需求一直在,只是传统的大数据实现系统需要考虑重新构建。而容器依靠其自身的标准化,一次构建,随处运行的能力,使得非常适合大数据系统的构建和管理。容器技术当前正是那只火遍全球的当红辣子鸡。

数据容器化,大势所趋

目前已经有大量的大数据系统原生支on Kubernetes。例如Spark官方版本,从2.3开始,就可以无需任何修改直接跑在K8s上。并且,将“更好的在k8s上运行”作为后续版本的重要特性方向。可见k8s对大数据系统的影响多么重要

队友已在加速,你感受到了么?

由于容器技术对大数据的这种良好助推作用,目前已经有不少技术嗅觉敏锐的头部玩家,开始尝鲜并从中捞取第一桶金。

例如:中国联通的容器化大数据平台实践;京东在使用Kubernetes管理大数据中心;网易基于Kubernetes和Docker构建构建猛犸大数据平台;茄子科技直接将大数据任务大量在生产环境跑在K8S之上;华为云DLI服务容器化,阿里云Flink on K8s等。这些可见的信息都表明这个大方向已经开始加速了。如果你还在艰难的维护着你那庞大的大数据系统,那么你需要停下里看看队友们在干什么。

BigData on K8s 最直接的优势不是性能提升,而是成本的下降。

(1)高利用率的资源调度平台。原来分散在多个集群中的业务,可以合并到统一的集群中,加上长任务短任务混部,及不同业务高峰时间的削峰填谷,来最大化提升集群资源利用率。

(2)统一的技术栈。原有的Yarn调度,节点管理技术,与当下宇宙标准K8s集群调度系统,目标是一样的。但是维护2种技术栈,就得增加研发人力成本,统一的基础设施技术栈,降成本效果明显。

(3)容器自动化能力。标准化是推动 IT 技术持续发展的原动力之一。容器技术本身理念就是一次构建,随处运行,这个与标准化理念是一致的。通过容器技术的标准化实施,并整合容器生态,建立运维系统。可以很好的降低业务系统的运维成本,甚至运维工具本身的构建和使用成本。

容器+存算分离,要速度也要成本

当前的大数据计算将计算和存储结合在一起的模式,是分布式架构构建的一种尝试。但是当社区修改HDFS以支持Hadoop 3.0的ErasureCode(纠删码)时,即接受了:不(Wu)再(Fa)支持就近读取的策略。它就代表了一种新趋势:为了适应不同场景,存储空间和算力配比应该是灵活的,可以分别独立的构建。

IDC中国报告指出:“解耦计算和存储在大数据部署中被证明是有用的,它提供了更高的资源利用率,更高的灵活性和更低的成本。”这一论断与很多企业正在进行的大数据架构变革不谋而合。

同时,伴随着容器技术的成熟及在各行业深入广泛的应用,企业愈发意识到容器技术的优势能很好解决大数据平台当前所遭遇的困境。容器以其更小颗粒度的算力分配、更轻量和快捷的部署方式、灵活的任务调度等特点,可以进一步提升资源利用率,并轻松应对大批量任务并发时的算力扩容。

鲲鹏之上,火山助力

华为云自主研发的鲲鹏处理器,具备多核高并发能力,可为用户提供包括裸金属服务器,云服务器,容器和Serverless在内的多种粒度的算力,大数据分布式场景性能可有大幅提升。

其中鲲鹏大数据容器,具有极致弹性的调度能力,可以每秒发放1000容器,减少资源弹性等待时间,提升计算效率。而裸金属容器技术,由于大幅降低虚拟化的开销,可更进一步的提升服务器执行业务的利用率。采用Serverless模式的容器集群,可以很好的支持按需弹性无限扩展,用来执行Spark大数据任务,轻松处理PB级数据作业。

Volcano(火山)项目是华为容器团队开源的一款K8s增强型调度器。初衷为了解决原生K8s不支持Gang Scheduling问题,后来由于AI和大数据等业务领域也开始对K8s有极大的述求,团队成员通过总结具体场景实践经验,打造有价值的技术产品,并贡献社区。

Volcano通过高性能的调度算法,达到更高的容器调度速度。同时,自带的多种算法插件,可以极大的提升集群资源利用率。同时,Volcano也补齐了K8s原生调度器与Yarn调度器间的Gap,例如资源的队列管理(Queue)能力等。为大数据容器解决方案,插上了带火的翅膀。

大数据世界,容器来助威

BigData Pro是业界首个鲲鹏大数据解决方案,该方案采用基于公有云的存算分离架构,以可无限弹性扩容的鲲鹏算力作为计算资源,以支持原生多协议的OBS对象存储服务为统一的存储数据湖,提供“存算分离、极致弹性、极致高效”的全新公有云大数据解决方案,大幅提升了大数据集群的资源利用率,能有效应对当前大数据行业存在的瓶颈,帮助企业应对5G+云+智能时代的全新挑战,实现企业智能化转型升级。

其中,鲲鹏大数据容器解决方案,作为BigData Pro解决方案中重要一员,更是提供了完整的容器化大数据解决方案。

在2019年度中国数据与存储峰会年度颁奖典礼上,华为云BigData Pro大数据解决方案荣获了“2019年度大数据产品金奖”,也再一次展示了华为云在大数据领域的不凡实力。

点击这里,了解更多精彩内容

【华为云技术分享】大数据容器化成趋势,华为云BigData Pro一马当先相关推荐

  1. 云技术与大数据开放市场(银联第一期技术开放日回顾2)

    接着之前介绍过的"移动人工智能与技术服务专场 ",我想继续分享开放日的 "云技术和大数据"专场,也供自己日后回顾. 2017年12月1日,以"技术开放 ...

  2. 大表与大表join数据倾斜_技术分享|大数据技术初探之Spark数据倾斜调优

    侯亚南 数据技术处 支宸啸 数据技术处 在大数据计算中,我们可能会遇到一个很棘手的问题--数据倾斜,此时spark任务的性能会比预期要差很多:绝大多数task都很快执行完成,但个别task执行极慢或者 ...

  3. 【华为云技术分享】数据赋能,如何精细化保障企业大数据安全

    云湖湖导读:随着企业业务的不断发展,企业大数据资产在企业辅助决策.用户画像.推荐系统等诸多业务流程中扮演着越来越重要的作用,如何保证企业大数据在满足各业务部门数据访问需求的同时又能精细化保障数据访问安 ...

  4. 【华为云技术分享】40%性能提升,华为云推出PostgreSQL 12 商用版

    摘要:日前,华为云数据库正式推出了RDS for PostgreSQL 12版本,并开始商用.本文将从华为云RDS for PostgreSQL 12的4大特性和架构图等多方面来解读华为云Postgr ...

  5. 【华为云技术分享】《跟唐老师学习云网络》 - Kubernetes网络实现

    当今K8s独霸天下之时,咱们站在更高的角度,好好的看看K8s的网络是以什么理念构筑的.以及一个容器集群的好保姆,是如何分别照顾 南北流量和东西流量的. 一.简单介绍下Kubernetes 略..容器集 ...

  6. 【华为云技术分享】从自建MongoDB聊聊云数据库MongoDB的蓬勃张力

    在很长一段时间内,企业为了自身发展大多选择自建数据库,而随着企业的发展壮大和数据量的猛增,自建数据库越来越不能满足企业对数据库提出的高要求,为了更好地管理和使用海量数据,越来越多企业选择把云下数据库迁 ...

  7. 【华为云技术分享】数据湖数据库,别再傻傻分不清了

    什么是数据湖 如果需要给数据湖下一个定义,可以定义为这样:数据湖是一个存储企业的各种各样原始数据的大型仓库,其中的数据可供存取.处理.分析及传输. 数据湖从企业的多个数据源获取原始数据,并且针对不同的 ...

  8. 【华为云技术分享】云图说|全新华为云云备份服务:为您的数据提供三合一的保障

    云上道路千万条,数据安全第一条.当不幸在云上发生病毒袭击.误删除.软件故障等"车祸"时,如果没有事先对数据进行保护,业务将会中断,并且将导致数据丢失.损坏的后果! 华为云云备份就像 ...

  9. 【华为云技术分享】Docker容器+Phoronix-Test-Suite测试X86和ARM的ffmpeg转码性能

    [摘要] 如何使用phoronix-test-suite跑ffmpeg转码性能测试,主要测试X86和ARM的.中间使用Docker容器方便操作过程. Phoronix Test Suite是一款性能测 ...

最新文章

  1. Vue 组件库 HeyUI@1.17.0 发布,新增 Skeleton 组件
  2. MD5加密解密帮助类
  3. 20211020 段院士全驱系统
  4. edge浏览器如何把网页放到桌面_最强桌面浏览器
  5. dnf一天能获得多少黑暗之眼_DNF:千万金币远古遗愿成废铁,95版本完美传说换装武器只需1个月...
  6. C++之invalid initialization of non-const reference of type ‘int’ from an rvalue of type ‘int’
  7. 给 iOS 11.3 降个级?苹果果断关闭 11.2.6 验证通道
  8. android ListView 自动滚动到最底部
  9. AS 3.0 socket 通信,比较基础比较全【转载】
  10. webservice解析xml文件
  11. 应用软件设计不是CRUD:如何进行应用系统功能模块的耦合性设计
  12. imagej批量处理图片
  13. 支持Tasker控制的app合集
  14. java幸运抽奖系统_java实现幸运抽奖系统
  15. 计算机组成原理复习提纲六(CPU结构和功能)
  16. F分布概率密度函数的推导
  17. excel拆分数据为多个工作表
  18. 深度Deepin系统关机或重启的时候提示unattended upgrades shutdown的解决办法
  19. OpenHarmony学习笔记——Hi3861使用DHT11获取温湿度
  20. Golang:Go 网络包默认值下的陷阱

热门文章

  1. vrep中remoteAPI 编程中遇到的没有预留命令执行时间遇到的问题
  2. 重庆大学李婷婷计算机学院,北京大学青年研究中心赴我校考察调研
  3. python每日一题今天的答案_python每日一题总结1
  4. 销货清单打印软件_地磅软件管理系统 大宗物资称重管理车运版
  5. [转]如何让DIV固定在页面的某个位置而不随着滚动条随意滚动
  6. adb server version (31) doesn't match this client (40); killing...
  7. Repeater内部排序
  8. What is an Operating System?
  9. 基于ThinkPHP3.23的简单ajax登陆案例
  10. C#退出窗体的总结方法