来源 | 阿里巴巴云原生公众号

2021 年 4 月 27 日,云原生计算基金会(CNCF)宣布通过全球 TOC 投票接纳 Fluid 成为 CNCF 官方沙箱项目。Fluid 是一个由南京大学、阿里云以及 Alluxio 开源社区联合发起并开源的云原生数据编排和加速系统。

Fluid 项目地址:
https://github.com/fluid-cloudnative/fluid

项目介绍

云原生环境下,计算存储分离架构在提升系统弹性和灵活性的同时,给大数据 / AI 等数据密集型应用带来了计算性能和管理效率方面的挑战。现有云原生编排框架运行此类应用面临数据访问延时高、多数据源联合分析难、应用使用数据过程复杂等痛点。Fluid 正是为解决这些问题而生的。


Fluid 系统架构图

Fluid 运行在 Kubernetes 上,是一个可扩展的分布式数据编排和加速系统,其目标为构建云原生环境下数据密集型应用的高效支撑平台。该项目开源于 2020 年 9 月,短短半年多时间内发展迅速,吸引了众多领域专家和工程师的关注与贡献,并在包括微博、中国电信等多家大型知名IT和互联网企业中使用。

核心功能

Fluid 在云原生应用与数据的协同编排、调度优化、数据缓存等几方面提出一系列技术创新,其核心功能包括:

  • 提供存储无感知的数据对象-数据集(Dataset):通过自定义资源对象 (Custom Resource Definition)实现对不同存储系统的统一抽象定义与管理,支持可观测性和弹性伸缩。
  • 利用分布式缓存技术加速数据集读写:通过扩展 CacheRuntime 对象,自定义并管理分布式数据缓存引擎。目前已原生支持缓存引擎 Alluxio 和 JindoFS。
  • 基于容器调度的智能数据编排:基于 Kubernetes 容器调度和扩缩容能力,实现数据缓存的智能化编排。
  • 数据集与应用协同调度:扩展 Kubernetes 调度器感知数据集缓存信息,就近调度应用,发挥本地读写缓存的性能优势。
  • 标准访问接口:使用 Kubernetes 标准存储接口 Persistent Volume Claim 访问数据集,实现无缝兼容云原生应用。
  • 面向场景的性能调优:针对深度学习、批量数据处理等任务,提供数据集预热、元数据管理优化、小文件 IO 优化、自动弹性伸缩等手段,普遍提升任务运行效率。

展望未来

Fluid 开源项目致力于通过结合学术界的原创研究和工业界的落地实践能力,加速云原生基础设施拥抱数据密集型应用,与开源社区一同构建 Kubernetes 平台应用使用和管理数据的统一界面。Fluid 开源社区目前有 5 位核心维护者 (Maintainer),分别来自南京大学,阿里巴巴和 Alluxio,并由来自南京大学 PASALab 的顾荣副研究员担任开源社区主席。此外,来自中国电信、微博、Boss 直聘、第四范式、云知声等企业的工程师都贡献了大量的开发工作。

作为对原生 Kubernetes 生态完全兼容的数据密集型应用运行支撑平台,Fluid 将向更灵活、智能、可扩展的架构方向发展,不断提升开发者和用户使用体验。未来,Fluid 将继续与社区并肩、与生态同行,致力于推进云原生技术在大数据 / AI 系统领域的生态建设与普及,与全球开发者一起拓展云原生的边界。

Fluid 进入 CNCF Sandbox,加速大数据和 AI 应用拥抱云原生相关推荐

  1. 什么是 Byzer-lang ? 一门面向大数据和 AI 的开源云原生编程语言

    什么是 Byzer ? Byzer ,又称为 Byzer-lang,一门面向 Data 和 AI 的低代码.云原生的开源编程语言. Byzer 这一名称源于中国古代神兽"白泽",其 ...

  2. 借力大数据、AI,机智云能否在物联网PaaS平台上更胜一筹?

    经过几年发展,物联网技术日益成熟,企业需求渐趋复杂,越来越多的企业将单一的设备连接和管理需求转向数据分析和场景应用. 技术层面,物联网与大数据呈现融合趋势.一些物联网云平台公司开始将品牌做厚,涉足数据 ...

  3. Fluid: 让大数据和 AI 拥抱云原生的一块重要拼图

    作者 | 顾荣.车漾.范斌 得益于容器化带来的高效部署.敏捷迭代,以及云计算在资源成本和弹性扩展方面的天然优势,以 Kubernetes 为代表的云原生编排框架吸引着越来越多的 AI 与大数据应用在其 ...

  4. 星环科技自研技术,加速大数据从持久化、统一化、资产化、业务化到生态化

    从2013年成立开始,星环科技就专注于大数据基础技术与企业数据业务的更好结合,同时面对中国更为复杂的数据应用场景,研发了多种更贴合国内大数据应用需求的大数据管理技术,在大数据技术领域有多项基础技术突破 ...

  5. 阿里飞天大数据飞天AI平台“双生”系统正式发布,9大全新数据产品集中亮相

    作者 | 夕颜 责编 | 唐小引 出品 | AI科技大本营(ID:rgznai100) 如今,大数据和 AI 已经成为两个分不开的词汇,没有大数据,AI 就失去了根基:没有 AI,数据不会呈现爆发式的 ...

  6. 贾扬清:如何看待人工智能方向的重要问题?【相辅相成不可或缺的两位“大数据和AI”】

    导读:今天的内容由阿里CIO学院攻"疫"技术公益培训贾扬清专场整理而来.直播中贾扬清向大家分享了人工智能的工程和产品实践,首先介绍了什么是人工智能以及人工智能的应用:然后和大家一起 ...

  7. 专访宜信AI中台团队负责人王东:智慧金融时代,大数据和AI如何为业务赋能

    前言:宜信技术人物专访是宜信技术学院推出的系列性专题,我们邀请软件研发行业的优秀技术人,分享自己在软件研发领域的实践经验和前瞻性观点. 第一期专访我们邀请到宜信科技中心AI中台负责人王东老师,从大数据 ...

  8. 智慧金融时代,大数据和AI如何为业务赋能

    前言:宜信技术人物专访是宜信技术学院推出的系列性专题,我们邀请软件研发行业的优秀技术人,分享自己在软件研发领域的实践经验和前瞻性观点. 第一期专访我们邀请到宜信科技中心AI中台负责人王东老师,从大数据 ...

  9. 大数据与AI的16个实践分享

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale活动 主办方:DataFun,指导单位:北京智源研究院 文章作者:Hoh Xi ...

最新文章

  1. 第一节 并发基础概念及实现、进程、线程基本概念
  2. Vue.js下拉框-详细省市联动示例
  3. python图形化界面按钮_Python-PyQt5-图形可视化界面(3)--按钮--Qpushbutton
  4. MySQL之Procedure(存储过程)和Function(函数)
  5. html5 canvas气泡动画
  6. 问答 | 为什么car-like robot需要使用差速器?
  7. 每日算法系列【LeetCode 239】滑动窗口最大值
  8. 空间里相片批量导入u盘_怎么批量把空间照片保存到u盘
  9. 算法第四版 课后习题答案
  10. python分词与去停用词简单实操
  11. 动态域名内网穿透(永久免费)
  12. 【Proteus仿真】TLC5615输出256点正弦波(振幅可调)
  13. matlab使用invfreqs出错,MATLAB实验2016剖析.doc
  14. 统计推断——假设检验——线性回归——R的平方可以为负数
  15. Hazelcast本地安装
  16. python数据分析之pandas数据合并
  17. 高精度地图-黑客又要开始装逼了!
  18. 中国卸油系统行业市场供需与战略研究报告
  19. 百度白皮书5.0解读如何合理设置展开全文功能
  20. uniapp实现简易的霍兰德职业倾向测评

热门文章

  1. 过滤输入字符串中的危险字符
  2. 1355. 母亲的牛奶【一般 / DFS爆搜】
  3. jQuery的祖先遍历
  4. java添加不了源代码,JAVA初学者的一些问题
  5. linux xfs文件误删除恢复_linux系统文件误删除恢复
  6. django orm级联_django+jquery 实现级联选择菜单
  7. android获取设备唯一标识_数据埋点:用户唯一标识
  8. 微软服务器系统玩游戏,微软将于2020年1月22日关闭Windows7游戏服务器
  9. 把tensor转为numpy_如何在TensorFlow中将张量转换为numpy数组?
  10. 【设计模式】单一职责原则