万万没想到,无人车其实是个劳动密集型产业
量子位
https://zhuanlan.zhihu.com/p/27795191
9 小时前
李杉 唐旭 编译整理

量子位 出品 | 公众号 QbitAI

病友们都在看杂志、刷Instagram的时候,Shari Forrest打开了手机上的一个app,开始训练一个将要用在无人车上的人工智能。

54岁的Forrest并非工程师或程序员,她靠撰写教材来谋生。尽管如此,在平时有空时,Forrest依然会在Mighty AI上登录,然后把自己的时间花在给行人、垃圾桶,以及任何其他你不希望无人车撞上的东西做标记上。

Mighty AI是一家人工智能众包服务平台。在这里,Forrest的“同事”们在全球范围内还有20万人。这家公司提供的主要服务包括计算机视觉、自动驾驶、自然语言处理等。今年1月,公司刚刚宣布完成1400万美元B轮融资。

“如果能趁着排队的工夫赚几块钱的话,何乐而不为呢。“Forrest说。

对于无人车产业而言,在自动驾驶时代真正到来之前,类似Forrest所做的这种数据标注工作都是不可或缺的。要对自动驾驶赖以实现的AI进行训练,所需的数据量往往超出了想象。

谷歌和通用这种公司很少去提这件事情,但正是像Forrest一样的人们组成的劳动力大军,构成了那些嗡嗡作响的数据中心背后的基石。

多数开发自动驾驶技术的公司会聘用成百上千名员工,然后把这种教会无人车识别行人、骑行者和其他障碍物的工作外包到印度或中国。这些工人需要对长达数千小时的视频逐帧进行标记。

“机器学习是个神话,就像《绿野仙踪》一样。”硅谷硬件孵化器公司Lemnos Labs的投资人Jeremy Conrad说,“标记团队对每家公司都至关重要,我们一段时间内仍然需要他们,因为户外环境十分多变。”

人工智能、传感器质量和计算能力的巨大进步,给无人车的革命打下了技术基础。然而,尽管出现了这些创新,但在未来很多年内,人类仍然需要在幕后默默奉献,才能让这些系统保持最好的状态。

“在我看来,人工智能从业人员整体都很自大,认为电脑可以解决一切。”Mighty AI创始人兼CEO Matt Bencke说。人工智能系统也都存在同样的问题:电脑需要通过人工添加标签的庞大数据进行“学习”,然后利用这种‘模型’在今后看到类似的物体和形态时将其识别出来。

训练无人车面临的挑战比其他人工智能应用更大,因为汽车所要面临的场景和环境是开放性的。即便是针对不同时间的灯光和天气环境进行调整后,城市环境仍会因为建筑、活动或事故而在一夜之间发生变化。

“标注过程通常都是一项非常隐秘的成本,很少被人提及。”自动驾驶创业公司Drive.ai首席执行官Sameep Tandon说,“这非常痛苦,也非常麻烦。”

无人车所需的精度也高于其他人工智能系统。汽车之所以能够自动驾驶,是通过将它们借助摄像头和传感器看到的周围环境,与车载3D地图进行比对来实现的。安全是头等大事:如果Google Photos的面部识别无法正确认出一张照片中的人,那也没什么大不了;但如果Waymo的无人车无法识别行人,就会引发致命事故。

在争相开发无人车的过程中,企业的衡量标准都是他们的累计行驶里程。Waymo今年5月表示,他们的汽车已经在公共道路上试驾了300万英里,而特斯拉去年表示,他们已经借助Autopilot系统,通过现有的车主收集了1000多万英里的驾驶数据。

然而,里程越多,就意味着这些公司的后台数据处理人员需要手工从事更多工作。短短几英里的驾驶里程就会产生数十GB的数据,这些数据很快就会变得过于庞大,以至于无法通过车载无线网络进行传输。相反,必须首先保存在硬盘之中,然后再传输到到外包中心。

这样一个拥有尖端技术的行业,却采用如此陈旧的模式,的确令人感到意外。

硅谷自动驾驶系统开发公司PlusAI首席执行官David Liu表示,每驾驶一个小时,就需要花费数百个小时才能将其转化成有用的数据。

他说,“我们需要几十万,甚至几百万小时的数据”才能让无人车随处行驶,并且需要“数十万人来实现这一目标”。

但大型科技公司通常不肯披露无人车所涉及的人工程序。Waymo、Uber和特斯拉均拒绝对此置评。

“很难听到有人谈论此事。”华盛顿大学计算机科学与工程教授Dan Weld说,“他们都喜欢说,机器学习很神奇。”

曾经担任Waymo和Uber工程师的Anthony Levandowski曾于2013年在加州大学伯克利分校的公开演讲中,将谷歌的印度团队称作一个由“人类机器人”组成的团队,他们负责标记街景服务采集的各种图像。

这种劳动密集型工作的成本并不低。业内人士估计,要创建和维护每座美国城市的地图,一年的花费约为数十亿美元。

有的创业公司从中看到了机会,PlusAI、Deepmap和Drive.ai都声称可以使用“深度学习”来降低人工成本(关于Drive.ai完全用深度学习来做无人车的方案,戳这里),但仍然可以维持安全驾驶所需的精度。但其他业内人士仍然怀疑,深度学习难以彻底摆脱对人类的依赖。

Mighty AI的 Bencke指出,Facebook、YouTube和Twitter面临的挑战,是如何在他们的社交平台上应对欺凌和恐怖主义等各种负面内容。“如果深度学习具备这种能力,你不认为它现在就应该已经解决这个问题了吗?”他说,“这个问题没有无人车那么复杂,而且市场很大。”

当下,AI的智慧在更大程度上仍然取决于它所用来训练的数据的质量。Bencke称自家的平台会用自己的机器学习技术,来判定每个人最为擅长的领域,并以此来分配工作。没人因此变得富裕,但对于Mighty AI来讲,这无关紧要。

Forrest说,自己去年在这项工作上挣了300美元,大部分都用来网购了。她从没见过无人车,更别提乘坐一次。但她知道自己正让它们变得更为聪明,也对这项技术的未来充满信心。

【完】

(转)万万没想到,无人车其实是个劳动密集型产业相关推荐

  1. 万万没想到:用理工科思维理解世界

    万万没想到:用理工科思维理解世界 万万没想到用理工科思维理解世界 序言 Part one人性 别想说服我 真理追求者 坏比好重要 最简单概率论的五个智慧 序言 长辈说:人到老年,看书看皮儿,看报看题儿 ...

  2. 【读书笔记】理工科思维解读《万万没想到》

    目录 一.逻辑脉络(框架) Part One 反常识思维 1 Part Two 成功学的解药 65 Part Three 霍金的答案 199 二.亮点 [亮点摘抄]-- 主要可查看"逻辑脉络 ...

  3. 万万没想到!电化学工作站操作如此简单

    万万没想到!电化学工作站操作如此简单 双单元电化学工作站是基于常规单通道系列CS350型发展而来,内置两套独立的恒电位/恒电流仪,每套恒电位仪各有一套辅助.工作和参比电极输出,并由软件来协调输出电位/ ...

  4. 和信创天下一代云桌面的三个“万万没想到”

    知名女演员李冰冰在第一次荣膺华表奖优秀女主角奖时,发表了一段感人至深的致辞:"刚才我从台下走到台上用了不到一分钟,但实际上我走了十年,终于拿到了这个奖项." 十年磨一剑,不仅可以磨 ...

  5. 显卡暴涨,这我万万没想到啊

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 梦晨 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI ...

  6. 万万没想到,坤坤洗白的第一步是周琦…

    前晚(2日)中国男篮与波兰队的关键一战惜败后,几乎所有中国球迷都在哭"琦","琦"到一夜未眠. 周琦关键时刻边线发球失误,硬生生把中国男篮提前出线的jio给拖了 ...

  7. 科学家们竟用乐高观察细胞,网友:万万没想到啊

    杨净 子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI 玩乐高还能玩出个显微镜?! 原本以为是一个普普通通的玩具. 没想到,还真能当成显微镜来用,是能看到细胞的那种. 真·高端新玩法! 比如 ...

  8. 显卡暴涨,等等党输了,这我万万没想到啊

    梦晨 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 万万没想到,去年信心满满准备好钱包要买30系显卡的我,现在连1660Ti都快买不起了. 不仅官方原价3899的RTX 3070,一路 ...

  9. 2015年第21本:万万没想到,用理工科思维理解世界

    <万万没想到:用理工科思维理解世界>这本书好像是从amazon排行榜中发现的,先是下载了电子版,竟然是一个博客(学而时嘻之)的大合集,可能是网上的某人用作者的博客制作而成的,共有123章! ...

  10. python这个软件学会能做什么工作-万万没想到,学会Python即使不做程序员都能月入过万!...

    昨天,我公司面试了1个同学,应聘新媒体运营,专业能力还不错.他简历上技能栏还写着会Python,我问了他一个通过爬虫采集数据的问题,他都顺畅的答出来了. 最后聊薪资时,他说期待7000,我直接给他开了 ...

最新文章

  1. git的基本使用-1
  2. hdu4549 M斐波那契数列
  3. Lesson 4.5 梯度下降优化基础:数据归一化与学习率调度
  4. 《机器学习实战》chapter02 K-近邻算法(KNN)
  5. macos剪切_如何使用macOS的内置“ Kill and Yank”作为替代剪切和粘贴
  6. bzoj 2178 圆的面积并 —— 辛普森积分
  7. php seaslog安装,浅谈win10下安装php seaslog扩展的方法
  8. 非一体式台式计算机,一体台式机推荐及介绍【详解】
  9. Struts2的标签概述
  10. python编程(基于订阅模式的mvc实现)
  11. git 中遇到的错误及解决方法
  12. 仿真器如何工作以及如何编写? [关闭]
  13. discuz源代码分析
  14. 效率工具 Snipaste、坚果云、印象笔记
  15. 宝宝起名神器小程序源码
  16. 大疆FPGA/芯片开发工程师(B卷)笔试题(含详解)
  17. 深度学习细颗粒图像分析综述
  18. 计算机应用基础图文混合排版,《Word 2010图文混合排版》教学设计与课后反思
  19. 阿里云新年活动 轻量云服务器1H2G5M仅需要86元/年
  20. 信创操作系统--统信UOS桌面版(玩游戏:安装Steam、Linux游戏、Windows游戏)

热门文章

  1. ali 媒体转码签名生成-php
  2. 简单的form表单操作(Servlet)
  3. jquery dropload
  4. 几何画板中该如何插入公式
  5. css(二) block,inline和inline-block概念和区别
  6. linux 自学系列:文件压缩
  7. CSDN西安分站俱乐部聚会归来记
  8. Java-注解第一篇认识Annotation
  9. Docker Compose 笔记
  10. Druid手动创建连接的坑