过去的2021年,对于数据标注行业而言,是略显“矛盾”的一年。

一方面以自动驾驶场景为核心的数据处理需求持续激增,数据标注行业迎来发展的沃土;另一方面,行业融资事件寥寥,且依然没有诞生独角兽企业。

与前十年野蛮增长不同,迈入下半场的数据标注行业急需的不仅是思考,更是改变。

自动驾驶进入商业化运营阶段

2021年,国内自动驾驶行业迎来新一轮发展高峰。

相关统计数据显示,过去一年国内自动驾驶行业披露的融资事件高达94起,融资总金额超435亿,同比历史最高。与之相对应,美国加州交通管理局DMV发布的2021年自动驾驶MPI数据中,中国企业占据榜单半数,其中,Auto X位列第一,滴滴位列第三,国内自动驾驶企业竞争力凸显。


自动驾驶行业的兴盛一方面与产业链不断升级相关,另一方面也离不开国家政策的大力引导。

产业链方面,摄像头、毫米波雷达、超声波雷达、激光雷达等硬件成本不断下降,自动驾驶感知系统愈发完善。以激光雷达为例,与前几年动辄上万美元的天价相比,目前主流激光雷达厂商的产品价格已大幅降低。

例如Luminar推出了1000美元的LiDAR解决方案,Velodyne公司则计划在未来几年将平均售价从17900美元降至600美元,而华为则宣布会将量产的激光雷达单价控制在200美元以内,这为自动驾驶汽车的大规模量产打下了坚实的基础。

政策方面,国家和地方政府先后出台多项政策性、规范性文件,鼓励自动驾驶行业健康有序发展。

自动驾驶分级标准方面,工业和信息化部率先推出国家级标准《汽车驾驶自动化分级》,对自动驾驶技术等级及其划分要素做出规定。在道路测试和市场准入方面,国家多部委也先后推出《智能网联汽车道路测试管理规范》、《道路交通安全法(修订建议稿)》、《智能网联汽车生产企业及产品准入管理指南(试行)》等多项重磅性产业政策。

在以上这些政策、法律规范的铺垫下,自动驾驶行业向商业化运营阶段迈出关键性一步:北京智能网联汽车政策先行区,在2021年向部分企业颁发国内首批自动驾驶车辆收费通知书,这让北京成为国内首个明确认可“Robotaxi”商业化试点的城市,同时也标志着国内自动驾驶赛道终于迎来商业化运营阶段。

数据标注行业的下半场

自动驾驶行业的繁荣也带动了上下游产业链的兴盛,尤其以数据标注行业为代表。

L3级别以上的自动驾驶系统主要由感知、定位、预测、决策和控制五部分构成,每部分均不可或缺。其对于计算机视觉技术的需求依赖度较高,系统需要对传感器采集的点云图像数据进行实时处理,构建车辆行驶环境,为预测和决策做依据,这对算法的准确性和实时性考验极大。

目前自动驾驶视觉技术主要以有监督深度学习方式为主,是基于已知变量和因变量推导函数关系的算法模型,需要大量标注数据对模型进行训练与调优。

换言之,想要让自动驾驶汽车更“智能”、自动驾驶算法能更加从容应对复杂多变的道路环境,背后就需要有海量且高质量的真实道路数据做支撑。相关统计数据显示,目前国内基础数据服务市场需求在200-500亿元规模,且保持每年30%-50%以上的高速增长。

然而,与快速扩张的市场需求相比,则是行业落后的生产力,集中表现在数据服务商产能无法满足市场需求以及数据产出质量较低两方面。

产能方面,目前国内数据标注第一梯队服务商年营业额普遍以千万级为主,业务规模、执行效率与项目经理能力高度绑定,产能瓶颈问题凸显,无法有效填补并抢占极速扩张的需求市场。数据标注产业在国内发展多年,却从未诞生独角兽企业。

数据产出质量方面,随着自动驾驶行业迈向商业化运营阶段,以点云数据为代表的数据处理需求占比逐渐扩大,传统依靠简单工具且依赖人力的业务执行方式,已经愈发无法满足垂直市场的需求。

站在产业发展的角度,数据标注行业的下半场,内部急需酝酿一场深度变革。

PLG模式下的增长飞轮

深度剖析数据标注行业存在的各类问题,会发现无论是产能扩张受限还是数据产出质量较低,都可以用一个更简练的原因概括:轻技术而重人力。

长期以来国内数据标注行业一直处于粗放状态中,行业门槛低,拉起一批人,经简单培训,依靠功能简陋的工具即可满足大部分标注项目需求,后期业务拓展则完全依赖销售驱动增长(SLG)。

这种模式在初期确实可以提供规模可观的业务量增长,但也很容易陷入扩张的瓶颈期,短期线性业务增长无法维系企业长期发展,过于依赖项目经理以及标注员的执行方式也会因人员流动而产生较大的波动性。

因此,数据标注行业的变革也将是一场业务模式的变革,而PLG模式有望成为解决行业困局的一剂良药。

PLG模式的英文全称是“Product Led Growth”,即产品驱动增长。这个概念最早由风投公司OpenView提出,该业务模式的核心依赖于产品自身作为获取、转化、扩展客户的动力。

2018年SaaS IPO公司的分析中,Openvie发现:PLG公司比其他非PLG同行表现更好,且估值高出30%。根据Bessemer Venture Partners (BVP)统计,在美国To B市场,PLG正成为一种主流的成长模式,这类公司在2020年的总市值接近6000亿美元。


相较于传统SLG(销售驱动增长)模式重销售轻体验,PLG模式更加注重产品自身,即产品力建设。数据标注行业以往“轻技术而重人力”的业务逻辑方式,已被市场证明存在业务增长受限、产品力无法满足甲方需求等问题,产能天花板更是成为困扰一众数据服务商的“顽疾”。

而PLG以产品力为核心的新模式,则赋予了数据服务企业以更低人力支出和边际成本,提供更具标准化解决方案的能力,高水准的数据智能平台更成为企业摆脱人力依赖,突破业务增长天花板,从线性增长到指数型增长的关键。

以曼孚科技SEED数据服务平台为例,作为曼孚科技第三代数据智能平台产品,SEED平台除拥有目前市面上主流第二代平台的“多场景标注能力+有限项目管理能力”以外,还创新性的大量引入生命周期管理、AI增强等模块,形成了覆盖“数据全生命周期管理能力+供应链管理+项目协同+AI人机协同+自定义权限+全场景标注”的多维立体数据处理能力。


在这些功能模块的加持下,平台数据标注效率平均提升10倍以上;AI辅助筛查下,数据精准度可达99.99%级别,直击AI企业数据需求痛点,从源头端解决AI应用场景持续拓展对于多源异构数据的海量需求。

从短期角度来看,PLG模式对企业而言意味着高投入与放弃短期增长,但从长远角度考量,以产品力为核心将更具竞争力,更是一种高效的增长模式。

数据标注行业的下半场,PLG模式有望为数据服务企业构筑起一条产品技术造就的护城河,成为驱动企业业务增长的飞轮。

数据标注下半场:PLG模式下的增长飞轮丨曼孚科技相关推荐

  1. 人工智能时代,数据标注产业将迎来黄金时期?丨曼孚科技

    在AI科技爆发的年代,智能已逐渐遍布各大行业,随着愈来愈多的产品都被赋上"AI+"文化,人工智能发展的浪潮已成为各企业新的探索目标,人工智能必将在支柱产业中占据一席之位,而这一方向 ...

  2. 2025年自动驾驶收割时,车企该如何应对数据标注问题?丨曼孚科技

    "2025年将是自动驾驶收割的时代,深圳智能网联汽车营收将达2000亿.上海公路将有七成以上自动驾驶汽车.北京又将这一数字提到了八成- " 种种迹象表明,在历经实验-应用-低迷-平 ...

  3. 数据集标注工具_如何提高数据标注质量,提供精细化标注数据集?丨曼孚科技...

    监督学习下的深度学习算法训练十分依赖于标注数据,然而目前数据标注行业在精细化运营方面仍有诸多不足. 相关数据显示,当下数据标注行业单次交付达标率低于50%,三次内交付达标率低于90%,远远不能满足AI ...

  4. 标注案例分享:自动驾驶图像语义分割丨曼孚科技

    目前,自动驾驶主流算法模型主要以有监督的深度学习方式为主,是基于已知变量和因变量推导函数关系的算法模型,需要大量的结构化标注数据对模型进行训练与调优. 自动驾驶领域常见的标注类型通常包括2D框.3D立 ...

  5. 一文读懂车载监控系统中的数据标注类型丨曼孚科技

    近年来,车载视频监控的市场需求呈飞速上涨之势. 随着人工智能技术不断融入社会,越来越多的行业进行了技术革新.车载监控作为监控视频行业的细分子行业,是视频监控在交通领域的重要应用. 5G.物联网.车联网 ...

  6. 数据标注员:时代的一粒沙,落到每个人身上都是一座山丨曼孚科技

    ​深夜11点,赵明在提交最后一个数据包后,终于长舒了一口气. 作为一名普通的数据标注员,这是他一周以来第一次早于午夜12前点下班. 十几天以前,他所在的团队接到了一个"大项目":在 ...

  7. 机器越“智能”,数据标注员越容易被淘汰?丨曼孚科技

    有这样一类人,他们是AI行业的赋能者,是智能时代的奠基人,他们就是人工智能背后的"人工"--数据标注员. 数据标注员的职责是帮助机器习得"知识",或者换一种说法 ...

  8. java按丨分割_全景语义分割主流数据导出格式:JSON+Mask丨曼孚科技

    图像全景语义分割是人工智能计算机视觉领域的一个重要分支,它结合了图像分类.目标检测与图像分割等技术,是针对图像数据所进行的一种像素级分类. 经过全景语义分割处理后的图像,广泛应用于自动驾驶.无人机等场 ...

  9. 曼孚科技荣登《2023自动驾驶数据标注公司排行》榜单TOP1

    近日,由极客网和极客智库发起评选的<2023自动驾驶数据标注公司排行>榜单正式揭晓,曼孚科技凭借行业领先的产品技术方案以及良好的用户口碑登顶榜单TOP1: 极客榜单是由极客网和极客智库根据 ...

最新文章

  1. Android中Parcel的分析以及使用
  2. Spring mvc 启动配置文件加载两遍问题
  3. 【SQLAlchemy】PostgreSQL的自增长主键定义
  4. 程序语言的奥妙:算法解读 ——读书笔记
  5. Android系统JNI的实现方式
  6. mysql 记录更新 内部_MySQL 入门(1):查询和更新的内部实现
  7. charles 安装 ssl_最全面的解决Charles手机抓包的证书问题(步骤非常详细)
  8. XML DOM Object Model in .NET [2/3]
  9. python矩阵转置_Python 矩阵转置的几种方法小结
  10. 斯坦福大学深度学习公开课cs231n学习笔记(7)神经网络防止数据过拟合:损失函数和正则化
  11. i++和++i哪个效率高
  12. TIPS-国库信息处理系统
  13. Python3,多线程爬取某瓣小电影~ ~
  14. java中什么是线程不安全给出一个例子
  15. Android中网络优化
  16. wdk与DDK有什么区别
  17. pygame安装(2020版超详细)
  18. java 在线测评_简单java在线测评程序
  19. 隐式转换、IF判断、逻辑【与、或、非】、三目运算的用法(基础)
  20. Springboot+JPA使用EntityManagerFactory手动开启事务

热门文章

  1. 使用JWPL处理维基百科数据-使用eclipse
  2. python双手打字_Python打字练习小游戏源代码
  3. matlab获取ipv4地址,【MATLAB】从 IP camera 撷取影像
  4. 什么样的Java程序员可以去BAT公司上班?
  5. ProSpec Persephin小鼠重组体解决方案
  6. 【路径规划】基于蚁群算法的多配送中心车辆路径优化方法matlab代码
  7. Python --- 输入、输出、运算符
  8. python学生姓名添加删除_python-函数-实现学生管理系统,完成对学员的增,删,改,查和退出学生管理系统。...
  9. 【Java知识体系】Redis实用教程,深入原理
  10. adb 连接逍遥游模拟器搭配monkey命令 抓取 logcat日志