作为一个2020年3月份才正式正名的一个岗位,开始就受到了很多关注,但也引发了很多争议。经过几年的发展人工智能很多领域已经落地初见成效,数据标注也逐渐要进入一个“洗牌期”。但很少有人关注从业者的发展,不管是在百度还是知乎去查找都很难找到一个很好的职业前景的说明,得到的标签基本都是“简单”、“重复”等等。那么在疫情之下可以吸收大量就业的岗位,作为从业者或者即将从业到底该如何选择?

到目前阶段个人不太赞同再把数据标注员比作AI的老师,去教AI如何认识世界。对于老师来讲“教”这个事情其实是不用对特定情况下结果负责的,而标注这件事发展到目前阶段则不然,更像“调音”的过程,是一个技术活,所以想要真的做好,就要更准确的理解并可以通过标注的方式进行“调音”。

所以本文重点从实际公司需求出发来分析,目前对于求职者如何更好的选择同时在这个行业发展的更好。下面我们从两大方面进行一个详细分析:1.职位和对应薪资,2.职位对应的要求。

本文原始数据主要采集自知乎、智联、猎聘、Boss、拉钩。

一.行业本身衍生出来的职位类型

首先我们先了解一下目前市场需求的数据标注的职位类型有哪些?个人认为行业初期行业内职业类型的单一是很正常的,由于粗狂发展最直接的赚钱并且最小的投入才是硬道理。但目前的阶段这个行业有哪些职位可以供大家选择?

1.可以看出来需求量最多依然是标注员的岗位,其次是审核员、经理,很容易理解这是基础的需求,其他岗位更多的也是从这个岗位衍生出来的。对于公司来讲也是最直接盈利点。

2.从需求量上来看,目前审核情况基本上是1:12,当然不排除审核员很多会有内部标注员晋升到质检员的情况,但是这个数字也基本在合理范围内。

3.从需求量上也可以看出,目前经理管理人员情况是1:21,目前也是比较合理的。

这里有两点值得注意,a.销售人员的需求量非常少,b.出现了明确针对数据标注行业的测试和产品的需求。这个也是值得各位小伙伴关注的。

二.对应岗位基础薪资情况

对应岗位的工资相比也是大家非常关心的问题,那么可以看到目前市场需求上的对应工资排名情况(此部分为基础工资)。

1.显而易见上面提到的需求量相对少的销售岗位是这个行业基础薪资最高,这个就很容易理解作为一个新兴的行业,销售不依赖于销售员,而是渠道为王,更多的是老板就是主要的销售手段。

2.在这里很明显的可以分出我们传统意义上的管理岗位和技术岗位,管理岗如总监、经理、主管,技术岗:测试、产品。

3.作为一个新兴的行业相对已有的成熟行业来讲,其行业衍生的岗位已经基本形成。

三.不同地域对于不同岗位的需求

很容易可以看到对于不同岗位需求度越丰富的地区,行业相对于其他行业的发展就会更快,那么假设你是可以到外地工作的话,最好选择哪些城市呢?我们可以分析一下。

1.可以看出从需求量上来说,北京、杭州、成都、深圳、上海、合肥的多样性会更多一些,可以说明行业在这些地方的发展相对较快。适合初入职场的同学去学习。

2.对于主管、总监、经理需求量多的城市,如:成都、西安、苏州、石家庄、长沙、贵阳等地,新成立的数据公司相对会比较多一些。更适合一些已经有一些行业经验的人去。

3.另外可以看出这个数据尾巴很长,涉及到中小城市很多,很符合我最近看的一篇关于说数据标注的工作让更多的年轻人又回到了家乡。

上图是数据标注员在各个地区的平均薪资情况,可以看出如果是刚毕业想从事数据标注员的同学,从平均薪资上来看选择顺序应该是:上海、深圳、苏州、北京、成都、厦门。

四.地区公司量的角度

某一个地区需求公司的多少也很大程度的决定了发展空间,毕竟选择行业是长远的,还要考虑到可跳槽的空间。

可以看出北京是当之无愧的榜首,其次杭州、上海、成都、深圳也是可以选择的。这样分析下来是不是有了心怡的地方了呢?

五.职位要求有哪些?

上面我们分析了需求公司的情况以及薪资情况,那么最重要的这份工作到底怎么干呢?接下来我们分析一下不同职位的岗位需要具备哪些能力呢?

 1.标注员

以文本为例:最低薪资和最高薪资的岗位要求有哪些不同呢?

  • 最低薪资:

职责描述:

1、快速学习掌握语义业务功能,掌握掌握司法知识和标注平台、工具功能;

2、进行日常语义需求的标注、问题反馈及需求总结;

任职要求:

1、语言学、法学相关专业,有较好理解能力;

2、熟练使用办公软件;

3、学习接收能力强,工作认真细心,责任心强有团队意识,有一定抗压能力;

  • 最高薪资:

工作职责:

1.深入理解和分析金融、保险、物流、证券等行业数据,并负责完成数据生产、标注、维护;

2.数据标注及检查:对不同项目所需的标注数据进行情感标注、关系判断需要根据语句判断两个实体及他们之间的关系是否准确;

3.能依据产品需求,对标注数据进行总结、分析,定期总结标注经验,提供标注工具的使用完善建议。

4.对接算法研发同事及数据标注人员,确保数据标注人员输出满足算法研发需求的数据。

任职资格:

1. 专科及以上学历,语言学、信息管理、中文信息处理等方向优先;

2. 熟悉使用办公软件,擅长excel最佳,大数据和算法是加分项;

3. 语言表达流畅,能理解数据需求,善于发现问题并及时反馈,具有敏锐的数据分析能力,办事踏实认真仔细;

4.具备敏捷的观察、判断能力,以及逻辑思维能力,具团队合作精神,有强烈的责任心和敬业精神;

优先条件:

1.有保险电话客户从业经验优先;

2.相关项目经历:词库、知识库建设等;

3.对词库、知识库建设;信息分类整理方向有浓厚兴趣。

很容易就可以看出要求的不同,当然也很客观的体现在薪资上了,所以如果想从事相关的小伙伴一定能要理解要面试公司的需求。在这里我们可以分析出来几个关键词:

  • 深入理解(对场景的深入理解)

  • 标注和审核(最基本的需求)

  • 可以依据产品需求(可以根据场景来处理数据)

  • 能与算法研发和标注员对接(能把场景需求和算法之间的关系进行转化)

  • 专科及以上学历(这个也是很关键的点也是新毕业同学的机会所在)

2.测试

  • 最低薪资

岗位职责

1、负责环视项目素材的采集和整理;

2、有效地执行测试用例,提交测试报告;

3、准确地定位并跟踪问题,推动问题及时合理地解决;

4、欢迎2020届毕业生投递;此岗位有毕业后留任机会。

岗位要求

1、计算机及相关专业专科以上学历;

2、熟练操作电脑和Excel,工作态度严谨。

3、逻辑思考能力强,有良好的学习能力;

4、对软件测试领域发现、分析和解决问题有浓厚的兴趣;

5、责任心强,工作积极、主动,注重总结;

6、有代码基础者优先,熟悉MongoDB数据库搭建语言,熟悉Linux系统下C编程优先。

  • 最高薪资

岗位职责:

1、负责人工智能深度学习算法的测试计划、测试用例的编写和测试执行;

2、负责人工智能深度学习算法的数据标注和审核;

3、负责人工智能数据标注工具的编写;

4、负责常规的数据测试和标注人员的管理、监督工作。

任职要求:

1、本科及以上学历,电子、自动化、通信、计算机类相关专业毕业;            2、负责人工智能深度学习算法测试和SDK应用测试工作;

3、负责人工智能深度学习数据标注规划以及审核等工作;

4、熟悉Python语言,能自己编写一些标注工具者优先。

5、具有快速学习能力和团队合作精神, 善于交流。

3.管理岗

岗位职责:

1、对AI业务数据标注和采集项目的完整生命周期负责,建立完善的标注和采集的流程,推动业务向规范化和规模化方向前进,定期对服务的项目进行总结和经验提升;

2、负责深入挖掘客户的需求并确认,和客户进行充分的沟通,保证项目的质量和进度,有效的控制项目风险,完成交付,提高客户满意度;

3、参与数据标注和采集业务的运营和决策,为该业务线总监提供强有力的支持,包括流程化管理、标注人员素质提升、第三方渠道维护和开发等一系列业务方面的工作;

岗位要求:

1、对人工智能行业的算法情况有一定的了解,掌握主流的文本、音频、图像方面对标注类型、质量管控等方面的要求;

2、具有数据标注和采集行业的服务经验2年以上;

3、有较强的统筹协调能力,做事细致,认真负责,具有良好的抗压能力和快速应变能力;

综上不管是基础岗位还是技术岗、管理岗位,对于能力的需求都是非常明显,如果你想从事相关工作,一定要会的能力也非常显而易见。同学们可以借鉴以上的需求对应学习。

今天文章有点长了,基本上从两个方向梳理了一下目前阶段数据标注行业如果想选择的话的需求以及前景和公司的要求。这个是一个新兴的行业有很多机遇也有很多挑战。最近也跟一些大学的老师交流,一些大专和本科也开设相关的大数据、人工智能的课程,但是就连老师可能很难讲清楚学生毕业了该如何选择工作,而数据标注或许是一个很好的选择。

最后我想说不管任何职业任何岗位都缺少不了用心、细心、专心。疫情影响很多传统岗位都面临着减员的情况,而数据标注行业的缺口依然巨大,所以希望本文可以帮助大家更清晰的梳理方向,也欢迎大家留言交流。

标注2.0:数据标注员如何进行从业选择?相关推荐

  1. PaddleX数据标注与Halcon数据标注与转换

    PaddleX数据标注与Halcon数据标注与转换 一.简介 二.PaddleX数据标注 2.1Labelme数据标注 2.2json数据转换 三.Halcon数据标注 3.1MVTec Deep L ...

  2. ByteBridge数据标注平台:图像分类数据标注服务

    ByteBridge数据标注平台:图像分类数据标注服务 ​ 2020年的一场疫情,打扰了人们工作与生活的节奏,但却无法打乱人们的爱美之心.物理条件的受限,不同产业线上线下的表现出现了天壤之别.但不可置 ...

  3. 数据集标注工具_数据标注分享9个数据标注工具

    本次分享一个谷歌暗度陈仓收集客户标注数据的故事,城市套路深,我要回农村:分享九个数据标注最常用的工具,涵盖打点,拉框,OCR,语义分割,3D等.01一个故事 2004 年,谷歌宣布开启全球图书馆馆藏图 ...

  4. 数据标注员需要专业系统的学习么?

    又是忙碌的4月份,好多小伙伴留言催更了,先给小伙伴们汇报一下最近在处理的一些事情的进展,然后针对最近跟小伙伴交流的一些问题跟大家在做一个分享. 在山西吕梁联合当地政府做了第一期人工智能训练师培训. 保 ...

  5. 数据标注:光鲜背后的付出

    ** 新生代农民工:数据标注 ** 5到10年后,当人工智能全面普及,科技先驱和新一代商业巨子注定会被时代的聚光灯铭记. 但今天却想说一个关于人工智能"从未被讲出"的故事,写一群时 ...

  6. AI发电厂——数据标注公司(国内数据标注公司服务调研)

    众所周知,深度学习需要大量的标记数据和高效的运算来做支撑. 计算资源只要从黄老板的公司订购就可以了,但大规模的高质量有标记数据却不是那么容易获得,让科研人员头疼不已. 应用时代而生的就是一大批数据众包 ...

  7. 分割 标注数据_7种常用的数据标注工具

    工欲善其事,必先利其器. 标注工具是数据标注行业的基础,一款好用的标注工具是提升标注效率与产出高质量标注数据的关键. 常用的数据标注工具主要有以下几种:2D框.语义分割.多边形分割.点标注.线标注.视 ...

  8. lisp 线性标注自动避让_《数据标注工程》第一章学习笔记及作业:数据标注概述...

    第一章:数据标注概述 一.数据标注的起源与发展 1.人工智能行业的发展 AI的概念:意指让机器具有像人一般的智能行为(1956年,达特茅斯会议,由约翰·麦卡锡提出) AI的发展:60多年来,浮浮沉沉. ...

  9. 什么是数据标注? 数据标注公司主要做什么?

    一.什么是数据标注? 1.数据标注定义 数据标注是对未经处理的语音.图片.文本.视频等数据进行加工处理, 并转换为机器可识别信息的过程.原始数据一般通过数据采集获得, 随后的数据标注相当于对数据进行加 ...

最新文章

  1. Debian中几个bash初始化脚本使用区别--【转载】
  2. Jquery获取外网IP
  3. 网络协议分析工具Ethereal的使用
  4. 软件工程专插本_2021年专插本部分招生专业(拟),广科/广东理工/华商/培正/松田/工商大!...
  5. javascript学习系列(4):数组中的some方法
  6. BugkuCTF-MISC题乌云邀请码
  7. 如何去掉UITableViewController中的分隔线setSeparatorStyle
  8. MVC Json方法里的一个坑
  9. HTML固定内容的css代码,普通文本重内容的HTML/CSS设计
  10. grub的boot loader安装在磁盘上的位置
  11. 信息论与编码_中大网络信息理论与编码研讨会成功举办 SYSU Workshop on Net. Info. Theory and Coding...
  12. day 0150面向对象-成员
  13. 解决--cidaemon cpu 100%
  14. python图案绘制解锁_PythonAppium实现安卓手机图形解锁
  15. Windows如何使用自带的桌面整理工具?
  16. 分享28个前端优秀项目源码(React+Vue+Node)
  17. Elasticsearch 数据迁移方案
  18. vr模拟电力场景安全应急培训,电力安全教育培训新方法
  19. CloseableHttpClient方式配置代理服务器访问外网
  20. 深海迷航显示无法连接服务器,深海迷航中管道怎么连接 | 手游网游页游攻略大全...

热门文章

  1. 【转】objective-c基本数据类型之输出格式符
  2. nodejs调用go语言
  3. C# 添加Word页眉、页脚
  4. python中正负号怎么表示_[转载]python中整数除法的正负号
  5. 哥大暴跌16名!2023 USNews 全美大学排名发布!
  6. 发票查验平台验证码识别
  7. ...weights already exists, disallowed. Did you mean to set reuse=True...(解决办法)
  8. Python OpenCV 实现魔方识别+复原
  9. 计算机cpu频率时钟周期,关于cpu:什么是时钟周期和时钟速度?
  10. body中的相关标签