摘要: 为什么要用Kubernetes去难为数据科学家呢?

2018年7月,阿里云将深度学习工具Arena贡献给了开源社区,数据科学家无需学习底层IT资源使用,即可在云端运行深度学习,一分钟内启动深度学习任务,十五分钟内创建异构计算集群。

为什么要有Arena这样的工具?

现在Kubernetres社区最流行的深度学习解决方案是KubeFlow,Arena是不是又重新造了个轮子?KubeFlow是基于Kubernetes构建的可组合,便携式, 可扩展的机器学习技术栈,支持实现从JupyterHub模型开发,TFJob模型训练到TF-serving,Seldon预测端到端的解决方案。但是KubeFlow需要用户精通Kubernetes,比如写一个TFJob的部署yaml文件,这对于机器学习平台最主要的使用者---数据科学家来说是非常有挑战的事情。

这与数据科学家的期望还有比较大的差距,数据科学家关心的是三件事:

  1. 数据从哪里来
  2. 如何运行机器学习的代码
  3. 训练结果(模型和日志)如何查看

数据科学家编写一些简单的脚本,在桌面机上运行机器学习代码,这是他们熟悉和喜欢的工作方式。但是利用桌面机进行模型训练,又会遇到由于硬盘空间有限导致处理数据量不足,无法使用分布式训练导致计算力受限等问题。

为此我们开发了Arena,用一个命令行工具屏蔽所有底层资源、环境管理、任务调度和GPU调度分配的复杂性,它帮助数据科学家以一种简单熟悉的方式提交训练任务并且检查训练进展。数据科学家在调用Arena的时候可以指定数据来源,代码下载和是否使用TensorBoard查看训练效果。

Arena有怎样的作用?

Arena目前支持单机训练和PS-Worker模式的分布式训练,其后端实现依赖于KubeFlow提供的TFJob,很快也会扩展到MPIJob,PytorchJob。

同时也支持实时训练的运维包括:
• 利用top命令监控GPU资源的分配和调度
• 支持CPU,GPU的资源监控
• 训练日志的实时查询

未来我们希望能够通过Arena实现深度学习生产流水线 - 集成训练数据管理,实验任务管理,模型开发,持续训练、评估,上线预测全流程。

Arena的目标就是让数据科学家简单的释放KubeFlow的洪荒之力,像桌面机上训练一样简单,同时又拥有了集群级别调度和管理的掌控性。为了能够更好的在社区内共享和合作,我们已经在github上开源了自己的代码:https://github.com/AliyunContainerService/arena,欢迎大家了解和使用,如果您觉得不错,请给我们点赞。如果您希望贡献代码,我们非常欢迎。

Arena背后的故事,阿里云容器深度学习解决方案

开源工具Arena脱胎于阿里云深度学习解决方案, 该方案已经支持多种深度学习框架(如Tensorflow、Caffe、Hovorod、Pytorch等),从始至终地支撑深度学习的整条生产流水线(集成训练数据管理、实验任务管理、模型开发、持续训练及评估、上线预测等环节)。

该方案深度整合阿里云资源与服务,高效使用CPU、GPU等异构资源,统一容器化编排管控,并提供多维度监控告警和运维平台。

写在最后

“深度学习为人工智能带来变革式的蓬勃发展,然而对计算和数据资源的依赖也急剧增加。” 阿里云相关技术负责人张凯表示:“基于容器和异构计算技术,阿里云为大规模训练提供端到端的支持,不断打磨使用更简单、功能更强大的深度学习解决方案。”

更多阿里云上深度学习分享可以移步:https://yq.aliyun.com/teams/11/type_blog-cid_211-page_1
如《Kubeflow实战系列-五篇》、《打造深度学习的云端实验室-三篇》、《TensorFlow的实验-六篇》

产品详情,请移步:https://cn.aliyun.com/solution/devops/deeplearning

近期直播回放页面:https://yq.aliyun.com/webinar/play/487
相关产品详情页面:https://promotion.aliyun.com/ntms/act/blockchainshow.html

原文链接

本文为云栖社区原创内容,未经允许不得转载。

开源工具Arena,数据科学家再也不用为Kubernetes犯难啦!相关推荐

  1. 漏洞扫描工具大全,妈妈再也不用担心我挖不到漏洞了

    漏洞扫描工具大全,妈妈再也不用担心我挖不到漏洞了 1.常见漏洞扫描工具 2.AWVS 3.AppScan 4.X-ray 5.Goby 6.Goby联动Xray 7.Goby联动御剑 1.常见漏洞扫描 ...

  2. 谷歌年度AI技术总结来了!Jeff Dean执笔,附赠27个开源工具和数据大礼包

    杨净 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI Jeff Dean亲笔盘点谷歌AI研究成果,已经成了一年一度的保留节目. 今年也不例外,还是他抽出一部分假期时间完成的. 过去一年,谷 ...

  3. 看看数据科学家们都在用什么:Github上的十大深度学习项目

    本文作者Matthew May是一位正在进行并行式机器学习算法研究的计算机硕士研究生,同时Matthew也是一位数据挖掘研习者,数据发烧友,热忱的机器学习科学家.开源工具在数据科学工作流中起到了愈发重 ...

  4. 数据科学家访谈录 百度网盘_您应该在数据科学访谈中向THEM提问。

    数据科学家访谈录 百度网盘 A quick search on Medium with the keywords "Data Science Interview" resulted ...

  5. 像数据科学家一样思考:12步指南(中)

    像数据科学家一样思考:12步指南(上)<像数据科学家一样思考> 7-工程产品 下一步是建立统计软件.如果统计是分析和从数据中得出结论的框架,那么软件就是将这个框架付诸行动的工具.数据科学家 ...

  6. 保姆级神器 Maven,再也不用担心项目构建搞崩了

    今天来给大家介绍一款项目构建神器--Maven,不仅能帮我们自动化构建,还能够抽象构建过程,提供构建任务实现:它跨平台,对外提供了一致的操作接口,这一切足以使它成为优秀的.流行的构建工具,从此以后,再 ...

  7. 如何成为一名「卓越」的数据科学家?

    今天与大家分享一位友人的文章,希望能解决一些数据新人心中的困惑,以便将数据科学的概念形成一个框架,为进一步深入研究打下基础.   编辑于 2017-03-11 @杨滔 ,曾任阿里巴巴集团高级数据挖掘专 ...

  8. 如何成为一名卓越的数据科学家?

    "如何成为一名卓越的数据科学家?"是我们讨论的主题. 所谓卓越,不是那些纸上谈兵.喜欢"3V"."4D"."大时代"的理 ...

  9. 数据科学家必知必会的7款Python工具,你会几个?

    如果你有志于做一个数据专家,你就应该保持一颗好奇心,总是不断探索,学习,问各种问题.在线入门教程和视频教程能帮你走出第一步,但是最好的方式就是通过熟悉各种已经在生产环境中使用的工具而为成为一个真正的数 ...

最新文章

  1. 区块链和智能合约的关系
  2. 干货 | 20多门AI网络课程资源(附链接)
  3. 清理无用的CSS样式比较有用的几个工具
  4. 如何清除浮动(float)所带来的影响
  5. RabbitMQ之队列优先级
  6. Red hat linux 下装mysql5问题总结
  7. Kudu1.1.0 、 Kudu1.2.0 Kudu1.3.0的版本信息异同比较
  8. 大数据告诉你,中国女人有多勤奋
  9. Queue Explorer过期处理
  10. Samsung原版44B0X的Bootloader分析
  11. python pexpect输出_关于多线程:如何使用pexpect获取python中子进程的自发输出
  12. java 8和jdk区别_java-8 – JDK 6和JDK8之间的Java Collection差异
  13. 章节3.1和3.2----栈的表示、实现和应用
  14. 《Java就业培训教程》_张孝祥_书内源码_02
  15. python如何安装pdfminer_Python3.8安装pdfminer
  16. Pandas基础|列方向分组变形
  17. 需要u3d资源吗,免费送哦
  18. 什么是泛域名?如何做泛域名解析?
  19. 【日常点滴016】python游戏库arcade结合Tiled map editor地图编辑器和Pymunk物理引擎制作游戏过程记录,并最终打包为exe文件
  20. 大数据领域的Benchmark介绍

热门文章

  1. 【LeetCode笔记】剑指 Offer 57-. 和为s的两个数字 (Java、对撞双指针)
  2. 【学习笔记】网络层——无分类编址CIDR、ARP协议、DHCP协议和ICMP协议
  3. 2020年度工作计划_2020最新年度个人工作计划(精选3篇)
  4. git两个账号切换_多个git账号之间的切换
  5. babylonjs 设置面板位置_一篇关于开关面板的详细集合,值得收藏转发
  6. hive mysql5.7_安装并使用mysql5.7作为hive的metastore
  7. python爬虫动态解析js_Python爬虫实战入门五:获取JS动态内容—爬取今日头条
  8. 将ubuntu配置为路由器_“名酒为王”时代来临但资源将尽,看泸州老窖如何进行“名酒资源再配置”丨深度观察...
  9. 一头华发梳得整齐,一袭素衣低调谦逊。她是著名的环境工程专家清华第一位女院士钱易教授。...
  10. 【文末有福利】破解逆概率的迷思