2020年虽说是艰难的一年,对于我个人来说是很有收获的一年,所以本篇文章也是想和小伙伴们一起分享回顾一下2020年,再一同展望一下2021年行业的发展,给更多的小伙伴提供更多的参考机会。所以本文从三个方面和大家交流一下。

  • 个人的回顾

  • 2020年数据标注行业回顾总结

  • 2021年数据行业的展望与机遇

一.个人的回顾

之所以要把个人的角度也放到一块内容来聊,有两个想法,第一在做公众号的将近一年的过程中,了解到很多小伙伴的有一些迷茫,希望我的一些总结可以给小伙伴一点参考和启发。第二是系统的总结回顾一下一年的事情。

  1. 公众号

    从2020年2月9日发布第一篇文章到目前发布了34篇原创文章,是我个人对行业的理解也是一种记录,很高兴作为一个90后能在我最好的年纪可以见证一个行业的从0起步发展壮大的过程并有机会参与其中,能让我真真切切的感觉到这个时代的发展变化的脉搏,这也是非常大的一种乐趣。更要感谢每一位关注我的小伙伴,可以有机会跟大家一起深入的交流,碰撞出想法和火花。

  2. 教育

    1. 结识了几位非常好的老师,一起出了一本《数据标注实用教程》的教材,为行业系统性发展做一些贡献,同时计划基于基础数据处理部分也要继续出几本系统的教材。

    2. 基于数据标注开发出了一套课程体系和实训平台,在学校、基地、企业落地使用。

    3. 数字产业学院的推进,前期准备工作基本完成,2021年有序推进。

    4. 搭建了数据标注的认证培训体系。

  3. 基地

    参与推进3个城市数据基地的落地工作,虽然疫情造成了一些影响,但是工作还是要有序进行。由于正在推进暂时还不方便透露。基地的作用主要是做基础数据人才的培养和数据相关业务的落地。

  4. 产业园

    参与在沈阳推进落一个供应链金融的数字产业园,数字经济实际是落地应该是基于数据的应用,也就是我们经常提到了数字产业化,产业数字化,脱离行业的技术最终也会是空中楼阁。所以数字经济最核心还是基于产业数据创造价值。也要结合实际行业需求来做数字创新。

在这个给做数据标注行业并且想深入发展的小伙伴一个小小的建议,数据标注是一个数据应用的处理环节,不实际产生核心价值,不管是个人从业者、还是创业来做这个方向的小伙伴,应该更多的考虑数据应用的上下链接或者拓展的协同发展。当然有在做以上几个方向的小伙伴,欢迎随时交流沟通。

二.2020年数据标注行业回顾总结

2020年发生了黑天鹅事件,对数据标注行业在上半年有很大的冲击,数据标注行业作为新生的数据服务行业核心业务还是依赖与算法公司的订单,所以在人工智能公司产品市场化不成熟、融资不顺的情况下,生意不好也是合理的。但是2020年对于人工智能基础数据服务的发展还是非常至关重要的一年。我们就分一下几个维度来回顾一下。

  1. 政策维度

    • 职业认定

    • 专业设立

  2. 行业数据维度

    注:原始数据来源于网络抓取,如有遗漏纯属正常

  • 2020年4月份-12月份数据标注业务相关公司数量对比

这两张图其实想表明两个问题和大家交流:

  • 2020年4月份到12月份的相关数据标注需求公司增量为24.78%。

  • 最近看到多家公司在宣传上表明自己的客户几千家,其实一直对于这类数据持有怀疑态度,所以挂上上面两张图只是友情提示一下,不管是基于哪种维度来统计的客户数量,故事要能讲的圆满。

  • 2020年4月份TOP15和12月份TOP15地区排名

2020年4月份:

2020年12月份:

注:很多渠道说这两年成都的发展势头特别猛,一看数据是真信了。

  • 2020年4月份TOP15和12月份地图分布

2020年4月份

2020年12月份:

  • 分公司或基地主要分布

    注:存在两家及两家分公司以上公司,排除母公司所在地外后成立分公司或基地地区的分布

目前来看全国至少38个城市分别在开设相关数据处理的项目或基地,可以给小伙伴们做一个很好的参考。

  • 建设分公司或者基地的公司分布情况

注:存在两家及两家分公司以上公司,排除母公司所在地外后成立分公司或基地地区的分布

从数据来看很多头部公司在各个地区也存在分公司或基地,那么未来可能就会存在存量市场中的订单释放分配问题。

三.2021年数据行业的展望与机遇

上面跟小伙伴们聊了一下2020年发生的节点事件以及一些基础数据。下面部分和大家聊聊2021年的一些展望和一些大胆设想。

但对于平台类公司的发展机遇个人认为也会在2021年展现出来,平台类核心应该是在数字处理的基础设施,在数据处理的效率和多场景化数据或解决方案的敏捷输出上。虽然在存量市场上由于成本等各个因素的影响下发展受限,但在增量市场的技术能力迁移应用上,是必然需要的。

先说一个问题,最近也有好多新入行的小伙伴留言,说新加入这个行业想多交流一下,个人建议如果没有从事过这个行业仅仅就是听说门槛比较低的创业项目的小伙伴谨慎入行,原因如下:

存量市场期大部分需求来源于人工智能算法公司研发阶段,这个阶段的需求特点是人工智能算法需求相对盲目、对整体模型训练所需数据预估存在较大偏差,所以需求量也相对较大,但是进入到产品场景化落地阶段模型对数据量的需求预估相对较准确、需求的针对性也更强,所以项目更多是短快的小项目。而这个研发过程是不可逆的,所以单个类型数据标注需求量成规律性变化就很好理解了。

在增量市场中客户的主力军更侧重于AI的真实应用客户,这边客户研发周期和成本更为看重、也更看重的是效果,更需求的是成体系的解决方案以及可敏捷开发的平台工具,所以个人认为在存量市场竞争激烈,增量市场中更重要的能力应该是敏捷、解决方案的反向输出。这样行业壁垒也会逐步建立,经过将近5年的发展,个人为2021年会是一个转折。

  1. 基地建设机遇、问题及建议的讨论

    1. 机遇

      去年中下旬开始陆续开始的数据标注基地建设逐步开始,但由于疫情原因整体的速度没有设想的速度发展,疫情逐渐平稳、又是十四五的开年搭着数字经济、人工智能、工业物联网等国家战略的加持2021年会有一个更好的释放,期待行业的蓬勃发展。

    2. 问题

      但对于基地发展来讲各个认为有两方面的问题比较突出。

      1. 行业订单释放的问题,从目前的数据来看各个数据处理需求的头部公司如阿里、字节跳动、科大讯飞、快手等都有分公司或基地。那么未来数据处理的需求的存量市场竞争会更为激烈,增量市场尽快打开的需求也迫在眉睫。

      2. 基地问题

        基地存在最大的问题的基地运营的问题,目前在行业中大部分平台类型的公司很多都是后起之秀,在基地实际运营上经验缺乏。很多三线及三线以下城市的产业链并不完整在以服务外包形式落地的项目缺乏产业链支撑,未来存在风险,所以在很多项目落地的时候应该更全面。

    3. 建议

      1. 基地发展模式是一种必然,这个是市场和政府发展的需求,也是抢占新数字经济生产力上游服务市场的好机会。但建议还是公司、政府要各司其职。

      2. 数据标注是一个数据处理的环节,不具有产生核心价值的能力,如果单独发展数据标注行业,其结果就是服务外包。建议结合当地的资源优势或地区发展战略优势快速建立具有产业场景化的数据处理、应用等上下游产业链。

  2. 平台类公司发展的困境与机遇

    个人认为今年平台类的标注公司的发展难度会增加,但在这种情况下更容易出现行业内的龙头企业,个人认为核心有三点:

    1. 平台类公司的竞争壁垒优势没有完全显现,对于存量市场来讲工具类型的平台公司的工具使用成本比较高。

    2. 由于基地的建设不少头部企业会把存量市场的业务分发到基地,各地方基地的建设也加快了实际数据供应商企业的正规发展,并且在合理情况的成本降低。

    3. 平台公司良性运营亟待提高,例如问题比较大的一个方面便是结算问题,大部分平台类公司的结算周期在合同上都会签拿到供应商发票后的30个工作日到45个工作日,而其实平台公司基本不会垫付项目款,也就是在客户给平台公司结算还会有一个周期时间,而如果客户支付项目款的周期为30个工作日,那么基本上供应商拿到项目款的周期就可能在30个工作日到75个工作日,很可能是一个季度,这样对于供应商来讲的项目资金成本就已经吃掉了利润的一部分,所以在这个逻辑下平台类的运营就无法形成良性。

    4. 之前也写过一篇文章讨论了一下关于很多公司发展方向的问题,产学院、再就业、扶贫、基础设施建设等方向,个人最不看好的就是拿扶贫作为宣传点的公司,数据标注的确是一个相对简单的数据岗位,但是其实也是一个技术岗,具有技术岗的基本素质要求和发展模式。

  3. 产学研发展讨论

    从成本的角度来看很早就有公司盯上了几个可以快速降低用工成本方式的方向,如扶贫、再就业、产学研等,本身这个行业进行产学研的发展模式也是一种必然,是产业发展与教育脱节的优化解决方式,但是个人非常反对粗暴式实训就业方式,以降低企业用工成本为出发点的产学研结合,这是一种非常不负责的。

    虽然职业化教育更多的是让孩子们可以学到实际工作的技能,在未来可以有一技之长傍身。但是个人认为数字经济时代的职业教育不应该仅仅如此,不能用工厂操作工人的思路来培养数字时代的孩子们,会做不在唯一要求,应该给孩子们未来更多的可能,以及掌握更多可迁移学习的能力。

    当下是数字经济初期,对于教育部在产学研相关政策的尝试也证明了是一次机遇,教育也会更深入的垂直化发展。在这方面今年我也下了很大的功夫去做数字化教育的研究,也欢迎小伙伴们交流。

  4. 2021年标注行业的转折年

    • 数据标注行业是一个服务外包行业更是精细化运营的行业,服务外包的意思很明晰了就是一个利润率相对固定,几乎没有溢价率的可能。精细化运营的意思就是基于项目整个流程都需要精准把控,一个环节失控都会导致成本的失控。

    • 数据标注行业作为服务外包,就高度依赖下游客户订单,所以如果没有接触过客户就不要贸然加入了,建议行业群仅仅是交流就好。

    • 数据标注行业大部分需要垫资,所以一定要有较为充足的资金量储备。

    • .......

以上就是对2020年的回顾以及2021年的展望,不管用什么样的思路去解决目前行业的问题或者什么样的路径去更好的实现数字经济,都是我们参与其中的这代人的幸运,可以用我们自己的方式去试图塑造历史、去推动发展,或许这才是最大的乐趣。希望2021年依然在行业内砥砺前行的小伙伴可以乘风破浪、披荆斩棘,在自己梦想的路上一路狂奔。

2020年感谢小伙伴的支持、2021年我们一起加油!!!

2020年数据标注行业回顾及2021年展望相关推荐

  1. 2020年数据中心行业研究报告

     摘要 据中国信通院数据,2019 年,以 IaaS.PaaS 和 SaaS 为代表的全球云计 算市场规模达到 1,883 亿美元,同比增长 20.9%. 数字化浪潮推动中美 IDC 行业发展 IDC ...

  2. vue 开发2017年变化回顾及2018年展望

    vue.js 变化 从 github 的发布记录我们可以看到2017年 vue.js 的第一个发布为 v2.1.9,最后一个为 v2.5.13,主要发布小版本 2.2~2.5.这些发布提升了vue 与 ...

  3. 银行业理财2020年12月报:船到中游浪更急,银行理财整改现状及2021年展望(20210103).PDF

    来源:光大证券 公众号:参一江湖 以上是资料部分内容截图 如需查看完整报告和报告下载或了解更多, 公众号:参一江湖 8月21日(国内券商)资料回顾总览 数量化策略跟踪评价月报:历次春季躁动行情中,领涨 ...

  4. 2020年数据智能领域的“三宗最”,吴晓波罗胖都没提!

    "点赞+在看+分享本篇文章到朋友圈,截图发送给数据猿小编(ID:datayuanfw1)即可进入数据猿核心读者群,并获现金红包1份.提示:添加小编微信,需注明公司.职务.姓名. 大数据产业创 ...

  5. 2021年人工智能数据采集标注行业四大趋势预测

    人工智能数据采集标注头部企业云测数据近日发布了<2021 年人工智能数据采集标注行业四大趋势预测>.云测数据认为,未来,高精度数据将成人工智能训练阶段追逐热点,具备主要需求方稳定的特点,存 ...

  6. 2022年中国工业机器人行业市场回顾及2023年发展前景预测分析

    工业机器人是一种能自动定位控制.可重复编程的.多功能的.多自由度的操作机,广泛应用于码垛.冲压.分拣.焊接.切割.喷涂.上下料等工业场景中,极大提高了生产效率.安全性以及智能化水平.工业机器人作为我国 ...

  7. 一个“Scale AI”,让整个国内数据标注行业都酸了!

    23岁.美籍华裔.E轮融资3.25亿美元.估值达到73亿美元.AI创业公司(数据标注方向). 上面是目前美国硅谷的一家名为"Scale AI"的以数据标注为核心业务的创业公司5年所 ...

  8. 洞悉2020年数据团队建设,我们和清华、领英一起搞了个大事情,你也可以参与!...

    我的公司是否需要独立的数据团队? 我该何时.怎么样建设自己的数据团队? 数据团队的价值如何衡量? 疫情之下,数据团队又受到哪些影响? 加入我们,一起透析数据团队建设全景! 数据驱动时代,数据团队作为一 ...

  9. 关于对2020年数据中心的发展的8个预测

    数据中心是您业务的核心载体,尽管您的公司由其员工.产品或服务决定生死,但是如果没有您的数据中心,它就不能交付任何级别的功能.可靠性和敏捷性.那么,2020年数据中心会有什么变化? 1.边缘计算的兴起 ...

最新文章

  1. 【ACM】杭电OJ 1013
  2. JdbcPagingItemReader多线程的Step
  3. 中间件及tomcat的内存溢出调优
  4. matlab命令大全,Matlab------------命令大全2
  5. 使用Cygwin登录Raspberry PI
  6. 不同表_一个公式搞定数据信息按类别拆分到不同工作表
  7. mysql long类型格式_MySQL 数据类型
  8. VoLTE业务端到端流程:IMS侧信令流程
  9. 游戏测试面试中问到的问题
  10. connect ETIMEDOUT
  11. 淘金网UCskype即时通讯软件定制
  12. 美国公布自动驾驶新政AV4.0;微软Access数据库出现漏洞,或致8.5万家企业面临风险;苹果谈论隐私问题……...
  13. 密码包含大写小写的英文字母数字和特殊字符正则
  14. 读书笔记:《乌合之众--这是一本书》
  15. Esp32 spi slave配置
  16. Echarts使用map3D+visualMap 实现地图下钻,区域高亮状态下变高
  17. 二次元动漫卡通风格手机APP应用下载页自适应源码
  18. 浅谈 CRTP:奇异递归模板模式
  19. Stata实验——关于我国GDP增长率和CONS增长率
  20. hmcl离线登陆_hmcl启动器下载

热门文章

  1. sip 协议注册流程
  2. 离散傅里叶变换DFT、离散余弦变换DCT、离散正弦变换DST,原理与公式推导
  3. Transformer:让ChatGPT站在肩膀上的巨人?
  4. 2017中国IP指数盛典:一场IP界的“华山论剑”,你敢赴约吗?
  5. c语言文件合并,c++实现合并文件以及拆分实例代码
  6. ArcGIS10.2下载安装 License Manager、ArcGIS Desktop、ArcGIS Server软件下载及破解
  7. c语言输入1个数字正数负数零的个数,输入n个整数,求输入正数之和,负数之和,并统计相应正数和负数的个数,以输入0表示输入结束....
  8. Python语句求一个正整数的全部约数
  9. ATF官方文档翻译(二):Authentication Framework Chain of Trust(身份验证框架和信任链)(1)
  10. 一句话的结束!句号问号叹号