中国AI产业背后的富士康工人:拿低工资为硅谷巨头的数据贴标

https://mp.weixin.qq.com/s/zeYWAxYWR8WGtm10csEFKQ


【导读】AI是人类想要实现真正自由的梦想,到那时很多工作都会自动化,但在此之前,达到这一目标需要投入大量的劳动力。而中国甚至全球的人工智能产业飞速发展的背后是无数年轻工人作支撑,他们拿着低薪做着数据贴标工作,服务着国际科技巨头。

多年前就有人提出,数据就是新的石油。

而如果数据是新的能源和宝藏,那么中国已经成为最大的生产国。这所工厂挤满了劳动者,他们正努力为机器学习标注图像和数据。

机器学习的训练需要大量数据,在过去十年中,机器学习对高质量手工标注数据的需求飙升。一位在数据标签公司工作的年轻人说:“我曾经认为机器是天才,但现在我才知道我们(人类劳动者)才是它们成为天才的背后原因。

所有新兴行业,包括人工智能,都伴随着新型蓝领劳动力的需求激增。在从事AI相关的公司内,比老一代更精通技术的年轻工人正在从事手工标记数据工作。

这些年轻员工通常分布在较小的城市里,而这些小城市拥有多家AI初创公司,而这些公司存在的唯一目的是为大型机器学习公司提供高质量的数据。此前,新智元也报道过这一产业现象:在河南一些农村地区,有一大群年轻人正成为“数据贴标人”,他们每天坐在电脑前八小时,点击几十张照片,概述背景、前景和特定物品。

AI产业成为劳动密集型工作?廉价劳动力需求激增

《Throwing Rocks at the Google Bus》一书的作者Rushkoff说:“(未来)找工作会更难,每个劳动者付出更多的时间却只能换来用更少的钱。技术似乎让我们永远处于这样一个状态,在这种状态下,劳动力和数据甚至时间都是从人类身上’压榨’出来。

在这样一个时代,数据标记工作似乎已经成为保住年轻人饭碗的蓝领工作,帮助他们远离AI时代下的失业危机。年轻一代似乎能够养活AI野兽而不是被它们吞噬。

一个典型的例子是位于北京的创业公司Mada Code,大概拥有自由员工10000人。这些自由职业者为各种任务标记数据,如光学字符识别(OCR)和自然语言处理。该公司将微软、卡内基-梅隆大学和其他国际公司及机构都视为客户。

这些年轻人有两种工作形式:可以通过网络在线形式,人们可以通过移动应用程序标记图片;另一种形式则在线下,工厂里满满都是“数据贴标人”,他们坐在电脑前,轮流做手工标记。

AI应该是人类想要实现真正自由的梦想,许多工作都能实现自动化。但在我们到达这样的理想境界之前,世界需要一大堆人类从事标记工作,这项工作可能是非常苛刻,也很单调乏味。

以最低的工资、最少的福利为硅谷巨头们工作

没有手工标记就没有机器学习,因此人工智能生态系统需要这样的行业。

图片来源:南华早报

正如一位中国数据标签公司的联合创始人所说:“ 我们是数字世界的建筑工人。我们的工作是不断地铺盖一块又一块砖。但如果没有我们在人工智能中发挥的重要作用,他们无法建造AI这座摩天大楼。”

但这些工厂的情况与硅谷的豪华办公室或北京深圳的中国科技中心截然不同。这些劳动者的工资很低,也不像许多科技公司还提供免费餐饮,更不可能有医疗保健甚至台球桌那样的其他福利。

但是没有这些劳动者,人工智能的革命几乎是不可能成功的。

这其实是一个积极的推动力,在劳动成本低得多的地区完成部分工作,可以进一步降低产业成本。在训练数据时,有些任务比其他任务困难得多,就像人体标记任务比别的都要困难得多,每个对象需要标记15-40个点。

Mada Code的项目经理说:“就像10年前那样,那时还没出现iPhone或富士康员工。我想当一些工作被取代时,总会有一些新工作岗位出现。

参考链接:

https://www.analyticsindiamag.com/human-data-labeling-factories-are-the-answer-to-chinas-growing-ai-ambitions/

中国AI产业背后的富士康工人:拿低工资为硅谷巨头的数据贴标相关推荐

  1. 2021中国AI产业10大趋势,一分钟看明白 | WAIC2021

    智库分析师 发自 凹非寺 量子位 报道 | 公众号 QbitAI 中国AI产业,现状到底几何? 在逛了足足3天的世界人工智能大会(WAIC)之后,与之相关的一幅全景图,逐渐浮现了出来. 从整体来看,A ...

  2. 五大因素推动中国AI崛起,生态报告概览中国AI产业 By 机器之心2017年7月17日 12:51 中国的人工智能将会在全世界扮演什么样的角色?最近,风险投资机构Vertex发表了一份生态研究报告

    五大因素推动中国AI崛起,生态报告概览中国AI产业 By 机器之心2017年7月17日 12:51 中国的人工智能将会在全世界扮演什么样的角色?最近,风险投资机构Vertex发表了一份生态研究报告,从 ...

  3. 【报告分享】2020年中国AI产业地图研究报告.pdf(附下载链接)

    今天给大家分享甲子光年于2020年5月份发布的报告<2020年中国AI产业地图研究报告.pdf>,甲子智库对中国市场尚在存续经营的2224家AI企业进行了梳理,从地域.领域.融资轮次.发展 ...

  4. 纵览2023世界人工智能大会:百模大战4个月,中国AI产业怎么样了?

    文|刘雨琦,编|王一粟 身处大模型的浪潮之中,AI的热度一波接着一波. 7月6日,2023年世界人工智能大会在上海召开,一度冲上了微博热搜榜.在5万平方米的会场中,400多家企业的展台员工都在不遗余力 ...

  5. 从中国AI的“直道超车”时刻,看百度何以奔赴星辰大海

    过去一年里,借"新技术革命"实现超车.摆脱"卡脖子"困境,是国人对中国科技的迫切期待,也成为中国科技企业所追逐的星辰大海. 目前,在移动互联网.人工智能.云计算 ...

  6. Nature解析中国AI现状,2030年能引领全球吗?

    来源:机器之心 <Nature>近日的一篇分析文章表示,中国的人工智能研究在质量上进步很快,但是在高影响的论文.人才和伦理上面还需要追赶美国. 中国巨大的人口总量帮助人脸检测技术快速进步. ...

  7. 中国AI企业吸金旺但90%亏损 今年将迎倒闭潮

    来源:网易智能 摘要: 据报道,自2017年人工智能成为国家战略目标后,相关产业迎来飞速发展机遇,更成为全球吸金能力最强的产业之一. 2017全年,大陆AI企业的融资总额已占到全球的7成,但其背后的隐 ...

  8. 中国AI企业不惧美国封杀 百度华为用一张图给你答案!

    几天前,美国商务部产业安全局(BIS)正式对外宣布,将28家中国组织和企业列入"实体清单".在28家企业中,海康威视.科大讯飞.旷世科技等8家人工智能公司位列其中.按照美国法律的规 ...

  9. 一切领先皆为序章,看AI产业融合新浪潮

    所谓十夫楺椎.众口所移,聚集意味着放大力量.AI技术的发展,同样也与城市聚集起来,建立起紧密的联系. 像是一提到自动驾驶,人们就会联想到路测政策更开放的美国亚利桑那州或正在建立测试中心的中国长沙.提到 ...

最新文章

  1. jquery选择器,多个元素+除首个元素+出去首尾元素
  2. Java实现数据库表结构导出到Excel
  3. centos7开启,关闭防火墙
  4. c#扩展方法奇思妙用变态篇四:string 的翻身革命
  5. Array Splitting
  6. subList生成的列表和原列表的对比
  7. MQ的连接是否是线程安全的
  8. MyBatis第1天
  9. 性能测试用例(转载)
  10. 机器学习-吴恩达-笔记-13-大规模机器学习
  11. 向VMware中的Linux虚拟机共享Windows宿主机的文件/文件夹
  12. install numpy for arm64
  13. P3052 [USACO12MAR]摩天大楼里的奶牛Cows in a Skyscraper [模拟退火]
  14. linux svn pacman,【图片】manjaro Linux 中的etc pacman.conf设置错误了,谁发个默认的我看看,谢谢大佬们了_manjaro吧_百度贴吧...
  15. Glib2之定义手册(十八)
  16. 有的同学提出安全问题
  17. 电脑有电流声怎么解决_为什么音箱有电流声?电脑音箱电流声怎么消除
  18. Web安全渗透测试基本流程
  19. 小米路由器mini 刷潘多拉固件教程
  20. log4j日志级别配置详解

热门文章

  1. 一。深入了解JDK1.8 从Package java.io开始
  2. 「尖峰对话」问题征集:向张宏江和John Hopcroft 近距离提问
  3. 谷歌创始人“退位”,印度CEO独挑大梁
  4. 科学世界的人文关怀:开源科学与人工智能
  5. 原来,程序的世界远比我想象的精彩
  6. Visual Studio 出现“无法解析的外部符号”错误
  7. Ubuntu下常用强化学习实验环境搭建(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)
  8. django 快速实现文件上传
  9. 《图像分类》概述,李飞飞经典CS231N2021《卷积神经网络视觉识别》课程第二讲!...
  10. 过去50年最重要的统计学思想!