陈天奇任CTO,TVM团队成立OctoML:让任何硬件都能部署机器学习模型
据机器之心消息,知名人工智能青年学者、华盛顿大学博士陈天奇于近期参与创建了创业公司 OctoML,担任 CTO 一职。

随着人工智能的火热,创业成为了众多 AI 人才毕业后的选择。

近日,机器之心了解到,机器学习领域知名青年学者陈天奇毕业后也参与创建了全新创业公司 OctoML,担任 CTO 一职。


陈天奇的领英资料界面。领英的公开信息显示,陈天奇目前担任 OctoML 的 CTO。

从公司的注册信息我们了解到,这是一家数月前刚刚注册、位于西雅图的创业公司。公司主页介绍称,「OctoML 拥有当前最先进的 AI、系统、编程语言、编译器和架构技术,可以让机器学习系统的优化和部署变得更加容易。该公司致力于打造一个可扩展、开放、中立的端到端栈,用于深度学习模型的优化和部署。」

而在公司成员方面,华盛顿大学教授 Luis Ceze 担任 OctoML 首席执行官(CEO)一职,他也是陈天奇在华盛顿大学读博期间合作较多的教授。Josh Fromm、Jared Roesch 等成员也都是华盛顿大学助理教授或者博士。

Jason Knight 曾为英特尔 AI 产品团队的软件负责人,现担任 OctoML 联合创始人、CPO。

从公司主页来看,OctoML 的创始团队几乎就是著名深度学习框架 TVM 的「原班人马」。而且,这家公司的愿景「让机器学习可以部署在所有硬件上」,也与后者几乎相同。这就不得不说到机器学习领域的重要工具 TVM 了。

新一代「机器学习系统」TVM

2017 年 8 月,华盛顿大学陈天奇等人开源了深度学习自动代码生成方法 TVM,对业界产生了深远的影响。利用这一工具,机器学习算法可以自动编译成可供下层硬件执行的机器语言,从而可以利用多种类型的算力。

TVM 是一个全新的框架,它可以:

优化 CPU、GPU 和其他专业化硬件的常规深度学习的计算量

自动转换计算图以最小化内存利用率,优化数据布局,融合计算模式

提供从现有的前端框架到裸机硬件的端到端编译,一直到浏览器可执行的 Javascript

TVM 的诞生意味着新的深度学习芯片,以及新的深度学习硬件体系成为了可能。

深度学习模型可以识别图像、处理自然语言,以及在部分具有挑战性的策略游戏中击败人类。在其技术发展的过程中,现代硬件稳步推进的计算能力扮演了不可或缺的作用。很多目前最为流行的深度学习框架,如 TensorFlow、MXNet、Caffe 和 PyTorch,支持在有限类型的服务器级 GPU 设备上获得加速,这种支持依赖于高度特化、供应商特定的 GPU 库。然而,专用深度学习加速器的种类越来越多,这意味着现代编译器与框架越来越难以覆盖所有的硬件。

陈天奇等人的最终目标是让深度学习负载可以轻松部署到所有硬件种类中:不仅包括 GPU、FPGA 和 ASIC(如谷歌 TPU),也包括嵌入式设备,这些硬件的内存组织与计算能力存在着显著的差异。考虑到这种需求的复杂性,开发一种能够将深度学习高级程序降低为适应任何硬件后端的低级优化代码的优化框架是最好的方法。

TVM 是一个端到端优化堆栈,该端到端优化编译器堆栈可降低和调整深度学习工作负载,以适应多种硬件后端。TVM 的设计目的是分离算法描述、调度和硬件接口。该原则受到 Halide 的计算/调度分离思想的启发,而且通过将调度与目标硬件内部函数分开而进行了扩展。这一额外分离使支持新型专用加速器及其对应新型内部函数成为可能。TVM 具备两个优化层:计算图优化层和新型调度基元的张量优化层。通过结合这两种优化层,TVM 从大部分深度学习框架中获取模型描述,执行高级和低级优化,生成特定硬件的后端优化代码,如树莓派、GPU 和基于 FPGA 的专用加速器。

陈天奇表示,TVM 尝试从更高的抽象层次上总结深度学习 op 的手工优化经验,使得用户可以快速地以自动或半自动的方法探索高效的 op 实现空间。

TVM 堆栈图,这一工具支持多种深度学习框架以及主流 CPU、GPU 以及专用深度学习加速器。

陈天奇其人

陈天奇是机器学习领域著名的青年华人学者之一,本科毕业于上海交通大学 ACM 班,硕士阶段也就读于上海交通大学,博士毕业于华盛顿大学计算机系,研究方向为大规模机器学习。他曾参与开发了 XGBoost、Apache MxNet、Apache TVM (https://tvm.ai/) 等著名机器学习工具,是最大开源分布式机器学习项目 DMLC 的发起人之一。

陈天奇与机器学习的缘分开始于高中一年级,他就读的松阳二中,是一所位于浙江小县城的中学。

陈天奇曾在知乎社区的问答中回忆自己第一次接触计算机科学的心路历程:「比较幸运的是,比起其他学科竞赛,OI 社区有很多在互联网上的公开资料,训练 OJ 和论坛社区(大榕树和 oibh)。这些都给了像我这样野路子的选手追寻自己的兴趣的机会。」

高二的时候,陈天奇靠着全部上搜索拿了 NOIP 的省二,高三又拿了省一。凭借 NOIP 成绩带来的高考加分,陈天奇进入上海交通大学的 acm 班,开始了在计算机科学上的旅程。

在拿到博士学位之前,陈天奇曾在微软亚洲研究院、华为诺亚方舟实验室等机构实习,还曾在其母校担任助教,讲授编译器、操作系统、数据库管理系统、数据挖掘和机器学习实践等课程。

硕士期间,陈天奇还获得了 2011 年 KDD Cup 的亚军和 2012 年 KDD Cup 的冠军。机器之心曾经转载过陈天奇关于自己科研生活的自述文章《机器学习科研的十年》,一定意义上,KDDCup12 的夺冠是他决定将科研之路进行到底的最重要因素。

2013 年,陈天奇在华盛顿大学开启了自己六年的博士生涯。读博期间,陈天奇遇见了要求严格的导师 Carlos,鼓励他「只做 best paper 水平的研究」。也正是在读博的这几年里,陈天奇等人完成了 TVM 等重要研究。

今年,陈天奇从华盛顿大学获得博士学位,其毕业后的去向成为备受关注的问题。

6 月份,他在 Twitter 上宣布自己将于 2020 年秋季加入卡耐基梅隆大学(CMU)任助理教授,成为加入 CMU 的年轻华人学者之一。同样宣布将于 2020 年加入 CMU 的还有 CycleGAN 作者朱俊彦。

参考链接:

https://octoml.ai/

https://www.bizapedia.com/trademarks/octoml-88542223.html

原文链接
https://www.jiqizhixin.com/articles/2019-10-16-8

如何评价陈天奇团队新开源的TVM?

陈天奇任CTO,TVM团队成立OctoML:让任何硬件都能部署机器学习模型相关推荐

  1. 陈天奇的tvm更新了:VTA,开源AI芯片栈

    陈天奇 发表于 tvm社区  量子位 搬运 | 公众号 QbitAI 华盛顿大学陈天奇博士近日在tvm社区介绍了VTA(Versatile Tensor Accelerator)项目,量子位全文搬运如 ...

  2. 陈天奇:首个机器学习编译课程!

    Datawhale干货 来源:机器之心编辑部 陈天奇:「因为世界上还没有关于这个方向的系统性课程,所以这一次尝试应该会是和小伙伴们共同的探索」. 随着机器学习框架和硬件需求的发展,机器学习 / 深度学 ...

  3. 【AI新星耀名校】陈天奇、朱俊彦、金驰加盟CMU、普林斯顿

    点击"简说Python",选择"置顶/星标公众号" 福利干货,第一时间送达!   新智元报道   来源:百度百科.个人主页等 编辑:金磊.小芹.张佳 本文转载自 ...

  4. 陈天奇团队发布TVM:把深度学习部署到手机、树莓派等更多硬件

    本文来自AI新媒体量子位(QbitAI) △ 陈天奇,华盛顿大学计算机系博士生,此前毕业于上海交通大学ACM班.XGBoost.cxxnet等著名机器学习工具的作者,MXNet的主要贡献者之一. DM ...

  5. 华盛顿大学成立SAML实验室:陈天奇参与,推进未来AI系统全栈研究

    安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI △ 陈天奇 昨天,TVM.XGBoost.cxxnet等机器学习工具的作者陈天奇宣布,自己所在的华盛顿大学新成立了一个实验室,组织代号& ...

  6. 我在iPhone上装了70亿参数大模型,来自陈天奇团队最新成果

    克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 跑大语言模型的门槛,已经降低到一部iPhone了. 当然安卓版本也有,只要手机RAM够6G,听上去是不是比用2060还要震撼? 而且这次还是开箱 ...

  7. 自动生成硬件优化内核:陈天奇等人发布深度学习编译器TVM

    有了 TVM,业界与学界开发者们可以快速.轻松地在各个系统(包括手机.嵌入式设备与低功耗芯片)上部署深度学习应用程序,同时无须担心资源与速度的限制.「TVM 作为神经网络和硬件后端之间的共同层,消除了 ...

  8. 陈天奇团队新研究:自动优化深度学习工作负载

    深度学习在我们的日常生活中已经无处不在.深度学习模型现在可以识别图像,理解自然语言,玩游戏,以及自动化系统决策(例如设备放置和索引).张量算符(tensor operators),如矩阵乘法和高维卷积 ...

  9. 陈天奇等人新作引爆AI界!手机原生跑大模型,算力不是问题了

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入->[Transformer]微信技术交流群 转载自:机器之心 从此,大模型可以在任何设备上编 ...

最新文章

  1. MySQL使用命令备份和还原数据库
  2. python psycopg2_如何在Python上用“pip”安装psycopg2?
  3. 渗透测试之子域到父域的横向移动(Sid History)
  4. Linux 用户与用户组管理
  5. 用户域名注册后 需要在租服务器吗,申请域名并缴费后,是不是还需要一个服务器,那怎么建服务器呢...
  6. HttpServletRequest中getAttribute()和getParameter()的区别
  7. java redis set list_RedisTemplate的各种操作(set、hash、list、string)_lichuangcsdn的博客-CSDN博客...
  8. oracle统计信息导出与导入目的,Oracle统计信息的导出与导入
  9. 一种语音识别的自动控制系统及方法与流程
  10. 数据分析数据挖掘(二)
  11. 码出高效:Java开发手册 ——百度网盘下载链接
  12. 【学习笔记】seckill-秒杀项目--(9)接口优化
  13. 5种Windows网络模型之select模型
  14. web 前端签名插件_手写签名插件—jSignature
  15. Java书写文字格斗游戏
  16. 《剑指offer》刷题笔记(发散思维能力):求1+2+3+...+n
  17. 关于ddk环境的配置
  18. 黑龙江东方学院18级计算机名单,黑龙江东方学院学生社团联合会2017年干事纳新名单公示...
  19. 若水三千,只取一瓢饮之
  20. 自适应方案:在vue项目中使用postcss-px2rem

热门文章

  1. 基于RTP协议的H.264视频传输系统:实现
  2. win 8 找回开始菜单
  3. TeamSpeak服务器无法运行,如何在启动时运行TeamSpeak3服务器?
  4. 华清远见上海中心22071班--10.8
  5. 读书系列2022(上)
  6. 计算机专业学数电模电哪本书,我该怎么学数电和模电啊?
  7. 英语作文计算机的用途和发展,初中英语作文80词带翻译:计算机发展
  8. 一道OJ题目:浮点数排序
  9. 如何设计低功耗SOC
  10. C/C++前置知识之术语表