受访者 | Graviti 创始人&CEO 崔运凯

记者 | Aholiab,编辑 | Carol

出品 | AI科技大本营(ID:rgznai100)

经过数年的发展,现在的人们谈到“AI”已经不再像过去一般感到遥不可及。但 AI 在国内发挥的作用仍然只是冰山一角,许多应用依旧没有落地,产业链等待完善,国内 AI生态的发展还需要一定的时间。

“2018 年我刚回国创业,想要做机器学习的模型,但找遍整个市场,都找不到一家满意的供应商。”AI 数据SaaS提供商 Graviti 创始人崔运凯告诉记者。

崔运凯毕业于上海交通大学与美国宾西法尼亚大学,曾是 Uber 无人驾驶部门的Tech Lead Manager ,属于该部门最早一批员工。2018 年,崔运凯从 Uber 离开,回国后却发现,国内不仅无人驾驶行业进度缓慢, AI 产业链也非常不完善,这给许多AI 创业公司带来非常大的挑战。

发现了行业在这部分的需求和空白后,2019 年,崔运凯正式创办了Graviti,致力于帮助人工智能开发者更好地管理和使用数据,通过涵盖数据全生命周期的一站式AI数据服务SaaS平台,加速数据在供需方之间的流通,为人工智能行业赋能。团队也吸引到了哈佛,UT Austin,密歇根大学以及国内上海交大、复旦、同济等一流高校的人才。

从 Uber 无人驾驶部门的Tech Lead Manager,到国内人工智能行业数据服务商,崔运凯见证了无人驾驶行业的崛起和发展,也对 AI 行业有着独到的见解。近日,CSDN记者采访了崔运凯,跟随着他的技术成长生涯,一起来听听他对无人驾驶与国内 AI 行业现状的理解。

Graviti创始人&CEO 崔运凯

因一个”秘密项目“,正式踏入无人驾驶的大门

CSDN:请简单介绍下你的个人经历? 

崔运凯:2012 年,我到了美国宾西法尼亚大学学习。2014 年毕业后留下来当了一年助理研究员,但发现这不是自己的兴趣所在,在一次机缘巧合的机会下,我后来在Uber的老板给我打来了一个电话,说他们在匹斯堡做一个秘密项目,我飞到了匹斯堡一看,原来是在做无人驾驶。

当时的老板是 CMU(卡耐基梅隆大学) 的一位教授,他离开 CMU 后加入的 Uber 。看完项目,临走前我问他为什么会加入 Uber ?他对我说了一句话让我至今为止都非常印象深刻:“ It's a once in a lifetime opportunity“。他认为这种改变世界的机会可能一生也遇不到一次,所以就加入了。我也深受他的感染和影响,所以在 2015 年就加入了 Uber 做无人驾驶的事情。

加入Uber 时,Uber 还算很早期的时候。50 多号人在一个废弃的工厂楼里办公,像一个创业公司一样,后来至少搬过 4 个办公点,见证了它的成长。2018 年 5 月我离开时,公司已经将近 1500 多人。

CSDN:在 Uber 时你主要负责的内容是哪些?

崔运凯:我是在 2017 年 2 月份时被提拔上了 Tech Lead的,带领一个小的工程师团队去做高精度地图的规模化生产,尤其是用 AI 算法来辅助人工实现规模化的生产。因为当时高精度地图是无人驾驶中比较重要的一部分。如何能快速升级和生产地图,是当时无人驾驶的厂商比较重要的需要攻克的难题,当时也有幸参与了整个过程

2018 年离开了美国,2019 年 4 月时创立了 Graviti。Graviti比较幸运的是,在 2019 年资本市场不是很热闹的情况下,获得了包括红杉资本、云启资本、真格基金、风和投资的投资,还是特别感激大家对我们的支持。

无人驾驶技术的发展

CSDN:很多人在刚开始职业生涯的时候会选择偏向互联网应用的大公司耕耘,你为何会选择自动驾驶领域来攻坚?有什么吸引你的地方?

崔运凯:关于谷歌和百度做无人驾驶的问题,我们可以回顾 2015 年初,那时候还没有Waymo这家公司,当时谷歌的无人驾驶叫 Google X,整个 X 部门都是做无人驾驶的研究员,人数大概不到100 人,所以只是谷歌内部的一个部门。而Waymo 成立到组建其实已经是 2016年、2017 年的事情,当时 Google 并没有严肃地将它作为一个主要的商业业务去思考。同理,百度也有很多战略业务,无人驾驶只是他们战略业务之一,百度有非常优秀的人才,但是更多的是把无人驾驶作为前沿的研究而非可以商业化的应用。

出行的基本原则满足的是人从 A 地点到 B 地点的诉求,实际上通过 Uber,打车、无人驾驶都可以满足,无人驾驶只是选项之一。而 Waymo这种纯粹的无人驾驶公司会面临一个问题:用户最初可能会因为新鲜感而选择尝试他们的服务,但长期看来,用户只是需要满足从 A 到 B 的需求,到后期追求的更多是便捷,所以还是会选择打车。但 Uber 的目标是:承认我的网络里包含了无人驾驶、有人驾驶这种混合的形态,永远以满足乘客从A到B的需求为优先。这样的商业模式在我看来才更可行。 

我之所以加入无人驾驶领域,是因为我发现无人驾驶实际上会涉及很多先进的技术,大大帮助知识层面的提升,需要学很多东西才能把无人驾驶做好,至少这部分是让我个人比较兴奋的,所以选择了无人驾驶这个方向。

CSDN:你认为无人驾驶的终极目标是「量产商用」,还是「应用普及」?中美技术的发展差异如何?

崔运凯:无人驾驶的形态有可能是长期的混合式的形态。因为在 2016 年 9 月时,Uber 为所有的匹斯堡的用户提供无人驾驶服务,每个人都有可能随机匹配到一辆无人驾驶车。我其实认为这已经是很好的无人驾驶商业化落地的方式了。

所以我认为,无人驾驶会以这种慢慢进入人们生活的方式,潜移默化地不断提高、迭代自己,通过与用户的交互体验来不断变得完美。是一个循序渐进的过程,不是一夜之间就被所有人接受。

从技术层面来说,我认为整体的无人驾驶技术还有挺长的一段路要走。美国的无人驾驶技术确实要比国内的领先很多,在市场应用、算法方面是差不多的,但实际上我们欠缺的是整个产业链上的提升,包括大量的人才积累、操作系统、硬件和芯片能力,也包括国家的一些政策等等,国内都有相对大的空白,有很大的空间可以去打开和探索。

让AI触手可及

CSDN:Graviti 诞生的经过是怎样的?

崔运凯:我在Uber从事无人驾驶研发的几年时间中,需要处理大量图像、点云等非结构化数据,并用这些数据训练算法。当时,Uber内部为了方便算法团队加快算法迭代效率,动用了很多资源开发了Michelangelo机器学习平台。很多有名的开源框架都诞生在这一过程中,包括Horovod。我碰巧作为最早的用户,看到了这个平台的成长,踩过的坑和积累的经验。而这样的投入对于一个初创的人工智能公司是不可想象的。而在获取真值方面,Uber不仅在印度有上千人的数据生产团队,还将部分数据的需求外包给位于西雅图的一家初创公司,除了要承受昂贵的价格,冗长的等待时间,还要面对海量数据的对接、跨境分发、检索、整理及增值数据的保存和使用等一系列难题。 

2018年离开Uber回国后,我加入了一家高精度地图初创公司担任合伙人,因高精度地图研发需要收集海量数据并训练大量模型,为了管理和使用这些数据,我们一直在寻找类似于Michelangelo的平台。我们找了各种各样的供应商,甚至包括多家国内头部云服务商,可是没有一家可以满足我们的需求,在那个瞬间感觉特别无助。 

当时我意识到无论是国内还是国外,人工智能研发的整个工具链都处于非常早期阶段而且不完善。如果我们再做一家人工智能公司,还会遇到同样的问题,还是要花很大代价把这些问题再解决一遍。后来我去找了很多在人工智能领域创业的朋友,发现他们也有同样的痛点。与其这样,不如专门做一家帮助开发者解决以图像、文字、视频为代表的非结构化数据管理和使用痛点的公司,让开发者从繁杂的数据管理中脱身,更好地将时间和精力集中在解决业务问题上。

我们希望所有的开发者都可以用到和大公司一样好用的工具,让人工智能不再遥远,我们创立Graviti就是肩负着这样的使命的。

CSDN:我们注意到Graviti的Slogan 是“让AI触手可及”,Graviti所面临的挑战是怎样的?难点在哪里?

崔运凯:这里我们先来区分一下结构化数据和非机构化数据。日常数据可以分为由程序生成的结构化数据与以视频、图像、文字为代表的非结构化数据。平日里大家接触到的数据处理大部分是针对结构化数据的处理,比如Excel表格,数据库等。而人工智能面对的更多是图像、文字、视频等非结构化数据。这些数据所占用的存储资源及处理难度是结构化数据的几百万倍甚至是几亿倍

举个例子,Excel表格中100条数据只有几KB大小,但是一个图片可能需要几MB的空间,而一个视频则需要几百MB的空间。这很直观的展现了结构化数据和非结构化数据在数量级上的对比。处理一个Excel表格和几张图片都是相对简单的任务,基本在个人电脑上都可以处理。但是AI要处理的任务可能是上百万个几百MB的视频,这里程序所面临的挑战和所需要耗费的存储和算力成本可想而知。全世界每天产生亿万量级的非结构化数据,是否能有效地处理好利用好这些数据,决定了人工智能的发展进程。

Graviti希望通过高效调度大量的算力及存储,利用大规模分布式并行化技术,打造一站式的创新解决方案,帮助解决非结构化数据从获取、管理、加工到使用的完整数据旅程中所面临的问题,这也是我们的价值所在。

CSDN:Graviti提供怎样的产品?又是如何解决开发者的痛点的?

崔运凯:大家猜猜支持一个10人算法团队高效运转需要多少资源?我们通过深度调查发现,至少要三个软件工程师提供工具开发和运维服务,需要配置百万元左右的深度学习训练机器,及百人左右的标注团队和上百TB到PB级的共享存储空间。这些加起来往往需要花掉企业千万级前置成本和百万级的维护费用。即使这些都具备,算法工程师还要将大量的时间花在找数据,清理数据,管理权限和可视化上,真正用于算法开发的时间屈指可数。

针对这个情况,Graviti提供了面向开发者的SaaS工具,集数据集管理,沙箱训练和模型评估于一体。打通数据在人工智能应用开发的各个环节中的流转。让企业0前置成本启动人工智能应用开发项目,后期费用跟随团队的扩张而增加、收缩而减少,让开发者真正专注在重要的事情上。

比如我们与淞泓智能的合作,就使用了我们的数据管理系统和模型评估系统,甚至包括模型管理系统,并为它搭建了一套在线测试平台,让它更好地去测试未来无人驾驶车辆的系统安全性;在伯克利(UC Berkeley)的合作中,也是通过我们的数据管理平台、评估系统,为其搭建了一个平台用来支持他们面向世界级的顶级学术人员和开发者发布的挑战赛,这样大家可以更好地促进相关技术的发展。

针对开发者对于真值数据的需求,Graviti提供了基于SaaS的标注服务。和其他标注公司不一样的是,我们的数据标注服务是一键式的。国内的标注公司通常是先联系BPO(商务流程外包Business Process Outsourcing),在线下的微信群里对接需求,发数据文档,他再去联系标注员,而很多标注员可能是第一次接触这样的任务,也没有特别适用的工具。但是在我们的体系里,所有对接都是在软件中交互完成,分发程序有一套算法,会自动找到最合适的标注员,通过发现任务、自主登录、接受培训考试去完成这样的工作。整个过程都是自动化的,效率和准确率都有很大的提升。我们会针对客户的业务情况做咨询,很多客户是做不到明确架构需求的,这时候就需要有人来从专业角度做梳理和设计,这也是我们服务的独特性所在。

我们也将在未来的一定时间点考虑开源我的软件或是去做开放平台,和更多合作伙伴做生态上的整合,协同解决更多AI问题,打造像Github一样被开发者喜爱的平台。

AI 只是个工具,不要太迷信 AI

CSDN:除了汽车领域之外,未来还会为其他行业或领域提供服务吗?

崔运凯:会的。汽车是目前的重点领域,毕竟在这个领域很多年了。而AI技术本身其实是通用的,我们做这套技术也是通用的,所以我们也在思考全球疫情蔓延的情况下,能否为医疗赋能,通过人工智能为人类健康做出自己力所能及的贡献。同时也希望能为互联网视频、新零售、智能制造、在线教育等领域智能化升级赋能。

CSDN:对于AI技术,你有什么想说的?

崔运凯:我认为,最重要的其实是「知其然也要知其所以然」。对于技术,开发者一定要不断向自己提问,不要满足于自己现有的知识,更多要问“为什么、可不可以做到更好”,发现一些新的方式加以创新,才能将 AI 这个技术用好。

另外,也希望所有的 AI 开发者不要太过于迷信 AI ,因为 AI 归根结底只是个工具,一个有价值的问题可能可以由多种不同的工具解决,AI 只是其中一种。所以用最好的工具解决它最应该解决的问题才是大家应该追求的。

推荐阅读
  • 追忆童年,教你用Python画出儿时卡通人物

  • 如何用NLP辅助投资分析?三大海外机构落地案例详解

  • Gary Marcus:因果熵理论的荒诞和认知科学带给AI的11个启示 | 文末赠书

  • AI 终极问题:我们的大脑是一台超级计算机吗?

  • 借助大数据进行社交媒体营销,企业们得这么玩!

  • 力挺比特币的世界第2交易员:仅次于索罗斯,连续25年无亏损

你点的每个“在看”,我都认真当成了AI

Uber 前无人驾驶工程师告诉你,国内无人驾驶之路还要走多久?相关推荐

  1. 如何成为一名无人驾驶工程师

    作者 | 刘少山 无人驾驶作为一项新兴技术,落地为产品需要大量算法.工程.产品贯通的AI全栈人才.笔者在最近一年招聘中发现,许多技术方向的同学对人工智能既爱又畏惧,一方面觉得这是未来,另一方面又觉得很 ...

  2. asu计算机工程师,优达udacity无人驾驶工程师第一二三期(全)

    第一学期 - 第一部分 简介 在这节课中,你将会了解无人驾驶车的组成系统和工作原理,并着手迎接你的第一个实战项目:检测车道线.同时,我们会介绍整个纳米项目和课程期间提供的各项学习服务. 第一学期 - ...

  3. 优达学城无人驾驶工程师——P1寻找车道线

    这次介绍的是优达学城的无人驾驶工程师的P1项目,利用车的前摄像头来识别当前车道的左右两边两条的车道线.测试图片和视频在文章最后的链接里. 一开始先倒包 #importing some useful p ...

  4. 【自动驾驶技术】优达学城无人驾驶工程师学习笔记(七)——计算机视觉基础

    计算机视觉基础目录 前言 颜色选择(Color Selection) 理论基础 代码实践 区域筛选(Region Masking) 理论基础 代码实践 Canny边缘检测 问题背景 Canny边缘检测 ...

  5. Udacity无人驾驶工程师课程笔记:1 计算机视觉基础——基于Hough变换的车道线提取

    Udacity无人驾驶工程师课程笔记:1 计算机视觉基础--基于Hough变换的车道线提取 图像处理 颜色选择 区域遮罩 组合颜色和区域选择 边缘检测 Canny边缘检测 Hough变换 Hough变 ...

  6. 平均年薪 50 万的无人驾驶工程师,需要掌握这 5 大关键技术

    微信公众号 关键字全网搜索最新排名 [机器学习算法]:排名第一 [机器学习]:排名第一 [Python]:排名第三 [算法]:排名第四 无人驾驶无疑是 2017 年人工智能领域最热的话题,它涉及了目标 ...

  7. 优达学城无人驾驶工程师——P5车辆检测功能

    这次讲的是优达学城无人驾驶工程师第一期的最后一个项目,车辆检测功能,代码如下. 导包 import cv2 import numpy as np import matplotlib.pyplot as ...

  8. 优达学城无人驾驶工程师——P4车道线检测功能

    这次讲的是优达学城的无人驾驶工程师的P4项目,利用车前方的摄像头检测车道线,下面开始我们的代码部分. import numpy as np import cv2 import glob import ...

  9. 【自动驾驶技术】优达学城无人驾驶工程师学习笔记(六)——Github与Markdown相关教程

    Github与Markdown相关教程 本博文为笔者关于优达学城无人驾驶工程师课程中计算机视觉基础部分的学习笔记,该部分为实现车道线图像识别功能的基础课程,关于本课程的详细说明请参考优达学城官网. 优 ...

最新文章

  1. JavaScript时间日期格式化
  2. Mysql多实例配置文档
  3. 统计学、数据分析、机器学习常用数据特征汇总
  4. java 随机生成图,Java中的快速实值随机生成器
  5. ld 指令c语言实现,C语言符号、指令表.doc
  6. python 目录下的文件_用python把文件夹下的所有文件包括文件夹里面的文件都拷贝到同一个目录下...
  7. 这两个小技巧,让SQL语句不仅躲了坑,还提升了1000倍
  8. 几何画板画椭圆_几何画板降龙十九式视频教程每天只要十分钟
  9. INSERT INTO SELECT FROM 的用法
  10. ZeroMQ文档白嫖:一文述完ZeroMQ的套接字选项
  11. deepin系统修改IP地址记录
  12. 论文笔记:BPR-Bayesian Personalized Ranking from Implicit Feedback | 推荐系统BPR算法分析
  13. Android——百度APIstore+Json——获取新闻频道+新闻数据
  14. OpenCV学习日记(2)
  15. 使用telnet登陆smtp服务发邮件(带身份验证)
  16. 【Android App】实现在线语音合成功能(使用云知声平台和WebSocket 超详细 附源码)
  17. GOIP卡机网关SIM 对接群呼叫客服系统 自动外呼
  18. Java字符串String相关
  19. 【转】Java8 函数式编程详解
  20. ESP8266 初次使用

热门文章

  1. jquery源码解析:each,makeArray,merge,grep,map详解
  2. epoll/select
  3. 基于HTML5的电信网管3D机房监控应用
  4. IDC行业前景,机遇与挑战并存
  5. BootStrap在一行如何展示多行单据
  6. 阅读Book: MultiObjective using Evolutionary Algorithms (5) ---- Non-Dominated Sorting of a Population
  7. Spring Boot 2.X 实现文件上传(三)
  8. 异常处理机制(Begin try Begin Catch)
  9. Map与List数据操作
  10. Zepto.js库touch模块代码解析