文章来源于AI的那些事儿,作者黄鸿波

在我30岁生日那天的文章中,我在文末给技术新人的几点建议中,第一点就提出来了“技术要先广后精”这个想法,今天我想针对这一点来谈谈我的看法。

企业喜欢什么样的人

我认为,IT行业实际上是一个两极化非常严重的行业,有的人工资非常高,有的人却找不到工作,这是为什么呢?要回答这个问题,我们首先要了解工资高的这一波人中,都有什么共同点。我从拉勾网上找了2个AI技术总监和技术专家的招聘要求:

我们可以着重来看一下上面用红色圈起来的部分,我们先来看下第一个招聘JD,在职位描述中,这个JD很明确的指出了,需要做业务需求的理解和解决,问题的公关,创新探索和推动研发上线,而在下面的任职要求中,我们也可以看到,他所要求的不仅仅是你对CV这一个专业领域的积累,更重要的是你对深度学习的其他技术,如对抗生成、强化学习等技术的熟练程度,以及对Hadoop、分布式、实时流计算等有着扎实的基础。

我们再来看下第二份JD,在第二份JD中职位描述的第一条很明确的说明了需要参与AI算法系统的建设,以及平台的搭建,而在任职要求中,除了要求对深度学习和机器学习相关技术的掌握之外,还要对数据处理、web前后端以及自动化运维有着比较强的开发能力,甚至对平台开发的能力也有一定的要求。

这两份JD都是总监和技术专家级别的JD,我们不难发现,在这两份JD中有一个非常明显的技术点,那就是它们都不是要求你在某一个领域的技术非常牛,而是要你除了对CV或NLP比较熟悉之外,还需要对分布式计算、AI周边领域甚至前后端及自动运维都比较熟,也就是说现在企业招人的时候,更注重的是一个人才的复合型。

这个时候有人可能会说,那如果我就是找NLP开发工程师,或者NLP高级工程师,那会不会就只会NLP技术就可以了呢?我们再来看另外一份JD。

在这份JD中,我们可以看到,工作经验只要1~3年,但是却仍然需要对分布式计算、数据挖掘等相关内容比较熟悉,那么这个时候,我们似乎就有些疑问了,为什么现在都是在这么要求,我只在我自己的专业领域中做的好不可以吗?

AI产品从无到有的过程

实际上,掌握多种技术,不仅是对企业负责,也是对自己负责。我们先来说说在AI领域中,一个实际的产品从无到有的过程。

说到产品从无到有的过程,我不想按照一个正常的套路来讲,我们现在假设这些都是1个人来完成,呃......假如我们就做一个简单的文本审核平台吧。

老板突然布置下来一个任务,做一个文本审核平台,目标只有1个,那就是,如果有黄色内容和涉政内容进来,就统统给过滤掉。

这个需求看起来不难,那么我们来看看怎么实现以及都会用到什么技术吧。


用什么模型?

遇到这个问题,有经验的同学首先就会想到2种解决思路,一种是用规则过滤,一种是做一个多分类的模型,假设我们就做一个多分类的模型吧,这个模型是3分类,涉黄、涉政和正常。我们现在假设选用textcnn模型作为我们目标的训练模型。(这里就会用到了深度学习技术和机器学习技术)


爬取数据

那么我们要想训练这个模型,第一步就是要弄到数据,一般来讲,公司很难有这种大批量的涉黄和涉政数据,所以这里就需要我们掌握爬虫相关的技术


数据处理

假设我们的数据以及爬取到了,下一步该干嘛呢?没错,我们应该把这些数据给处理成我们模型可以接受的格式,然后喂到模型里进行训练,那么这里,我们可能就会需要使用到数据处理、正则表达式、分词技术以及其他的文本处理技术


数据训练

现在数据也有了,也处理成了我们想要的输入形式了,那么接下来要做的就是把这些数据喂到模型里进行训练,那么在这里就需要对深度学习的框架有一定的了解,可以是TensorFlow、pytorch和keras中的一种,那么这也是我们要学的知识点。


模型调参

现在模型训练好了,但是我们在验证的过程中发现总是有一类数据模型训练的有问题,或者loss不收敛,那么这个时候我们就要做模型调参工作,不错,这个时候你又化身成了一个调参工程师


模型部署

现在模型终于调好了,准备给领导看效果了,可是你发现领导可能不懂AI,也不愿意看一片黑漆漆的控制台,老板此时说了:“能不能让我属于一句话,就告诉我它是涉黄、还是涉政还是正常,最好是弄个接口之类的吧,我对http调用还是比较熟悉的”,好吧,这个时候你又需要把你训练好的模型部署发布成一个接口,这时候,你会发现又有新的知识了,因为你只对python熟悉,所以你通过查找资料,发现可以使用flask框架来做相关的http接口,当你把接口搭建好了之后,发现你还没有让接口和模型联系在一起,这个时候,你又需要去了解TensorFlow模型如何打包成Pb格式的数据,如何进行模型的调用,如何加载,ok,这个时候,你又不得不去学习python中的消息队列,管道以及与TensorFlow相关的模型部署和搭建相关的知识


模型上线

现在模型部署好了,老板也能够通过接口快速的得到响应了,老板表示非常满意。那么接下来就要把这个模型上线给到用户去用了。这还不简单,直接把http接口暴露给公网不就好了。

模型终于上线了,用户终于可以用了,第一天访问量30个人,没问题,效果很好。这个口碑一传十、十传百的传开了,终于有一天,并发量到了100了,然后你会发现,邮箱里收到了各种time out的报错日志。好吧,这个时候又要学新的知识了,如何进行分布式部署,如何进行负载均衡,Nginx,uwsgi,这几个新的知识又要开始学了,最终模型顺利稳定的上线了。

经过了这一番折腾,你会发现你不知不觉的学会了如下内容:

1、模型的选型

2、爬虫

3、数据处理和基础NLP内容

4、深度学习框架

5、模型调参

6、http接口

7、Flask

8、TensorFlow工程化

9、Python管道和队列

10、负载均衡

11、Nginx

12、Uwsgi

13、Linux操作系统 等等

如果这个时候老板让你再做的好看点,说不定你还要去学习前台界面开发相关的内容。

所以,我们再回到最初的问题上,为什么在各个企业的招聘JD上会有这么多的要求,实际上不是企业要求高,而是这些我们真的需要掌握。

技术要先广后精

上面啰嗦了那么多,其实,我只是想跟大家说明一个道理,那就是,对于一个IT新人或者说是AI新人来讲,我们一定要抱着技术要先广后精这个心态去做事。

实际上,技术的积累是一个长期的过程,我们应该时时刻刻的注重技术的积累。而我认为,技术的积累应该从本科就开始,甚至说工程化的积累,我们就应该从本科开始。

在上大学的时候,我们实际上就已经可以做很多的项目了,大学的课程包含着Java、C#、jsp、asp.net等,一般来讲,每门课程老师也都会布置一个大作业让大家去完成,一个注重积累的人,会认真的对待老师的每一次大作业,并对大作业进行持续的改进,而这个过程实际上就是一个积累的过程。当你完成了对一个项目从0到1 的部署,你会发现你所掌握的知识点变得非常多,你就可以把所有的知识体系联系到一起,形成一套自己完整的知识体系。

当你在走上工作岗位时、或者是面试的时候,你就会发现,你可以通过一个点来谈及一个面,然后考虑问题就会从宏观的角度去考虑,到这个时候,你就会发现,整个人的眼界都变了,看问题的角度也变了,很多事情你会想的非常的全面,老板也会越来越重视你。

 

所以,话又说回来,为什么我认为技术要先广后精,因为只有站在全局来看待问题,你才能够知道应该从那个点突破,来去深入的研究,只有这样,我们才能使自己的职业道路走得越来越宽。

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习在线手册深度学习在线手册AI基础下载(pdf更新到25集)本站qq群1003271085,加入微信群请回复“加群”获取一折本站知识星球优惠券,复制链接直接打开:https://t.zsxq.com/yFQV7am喜欢文章,点个在看

【深度总结】聊聊为什么技术要先广后精,对技术新人的几点建议相关推荐

  1. 助力苏州、星火相传,广苏两地微软技术俱乐部交流纪实

    2019年1月19日时值二十四节气"大寒"前夕,江南水乡冬日的寒气盖不住苏州.NET开发者的热情,就在这一天苏州微软技术俱乐部成立了并举办了第一场大型的线下交流活动. 星火相传 2 ...

  2. 三维全景导航、偏航识别、深度学习偏航引擎,滴滴导航若干关键功能的技术突破与实践...

    导读:滴滴导航是滴滴出行旗下基于丰富的交通大数据和领先的算法策略,面向网约车及自驾场景而打造的一款技术领先的地图产品.伴随着海量网约车司机每日8小时+的导航使用,产品积累了大量的反馈并持续优化打磨.在 ...

  3. 再次聊聊UCloud的中立,远不是云计算技术这么简单

    每年UCloud的用户大会,大数网基本都在现场,可以说见证了它的诞生.成长.最大的感受,从呱呱坠地到枝繁叶茂,UCloud一直有自己的坚持.今年2019 UCloud用户大会暨Think in Clo ...

  4. 深度学习在机器视觉应用领域的最新研究综述(物联网技术应用大作业)

    摘要:机器视觉是人工智能正在快速发展的一个分支.简单说来,机器视觉就是用机器代替人眼来做测量和判断.机器视觉系统是通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号, ...

  5. 深度探秘大数据新应用,2018 中国大数据技术大会(BDTC)强势来袭!

    2018 年12 月 6 -8日,由中国计算机学会主办,CCF大数据专家委员会承办,CSDN.中科天玑数据科技股份有限公司协办的2018 中国大数据技术大会(BDTC),在北京新云南皇冠假日酒店隆重召 ...

  6. 动手深度学习13——计算机视觉:数据增广、图片分类

    文章目录 一.数据增广 1.1 为何进行数据增广? 1.2 常见图片增广方式 1.2.1 翻转 1.2.2 切割(裁剪) 1.2.3 改变颜色 1.2.4 综合使用 1.3 使用图像增广进行训练 1. ...

  7. 基于深度学习的探地雷达图像异常智能判译技术和软件

    基于深度学习的探地雷达图像异常智能判译技术和软件 近几年城市道路坍塌事故频发,预防此类事故的发生,需要一种高效的道路检测手段,对道路无损害且高效的车载阵列式三维探地雷达是完成此项工作最适合的技术. 但 ...

  8. 从贝叶斯计算、深度学习、智能投顾看人工智能与区块链技术

    人工智能与区块链技术研讨会西安站"9 日在西安电子科技大学举行.这是继北京站顺利举办之后,人工智能与区块链技术研讨会全球巡回的第二站.包括西安电子科技大学通院电子实验室主任刘乃东.清华大学软 ...

  9. 技术福利丨深度解读抖音同款 RTC 产品背后的关键技术

    1% 的极致体验背后,是 99% 的技术探索. 从 2017 年开始,火山引擎 RTC 就开始抖音提供实时音视频服务,助力抖音打造过亿级 DAU 的现象级产品. 抖音同款 RTC 产品背后蕴含着怎样的 ...

最新文章

  1. Installation failed with message Invalid File:(Application Installatino Failed)
  2. Python初学者必学的20个重要技巧
  3. AMiner新功能:技术趋势分析—挖掘技术源头、近期热度和全局热度
  4. ECSHOP商品编辑器上传中文名图片产生乱码
  5. Python使用aiohttp异步爬取糗事百科
  6. 苹果 App Store 申请和管理相关知识
  7. python学习(三)数字类型示例
  8. springmvc jpa_使用JavaConfig的SpringMVC4 + Spring Data JPA + SpringSecurity配置
  9. windows7使用Sphinx+PHP+MySQL详细介绍
  10. 全国计算机一级考试试题大题,2016年全国计算机一级考试试题汇集
  11. Python20-Day03
  12. Entity Framework 学习中级篇1—EF支持复杂类型的实现
  13. java怎么返回上一部,如何返回数据给上一个活动
  14. 单片机学习都时候需要注意的步骤-依葫芦画瓢
  15. jquery的函数介绍和使用
  16. webbrowser点击网页内部链接阻止从IE打开
  17. pr基本图形模板无法使用_Pr基本图形板块教程 Premiere Pro CC Essential Graphics
  18. 库卡机器人是s7编程_青岛KUKA库卡机器人编程调试,维保,科普无限,崇尚科学...
  19. 论文笔记2:Deep Attention Recurrent Q-Network
  20. Win10 下安装Win7双系统

热门文章

  1. Promise的源码实现(完美符合Promise/A+规范)
  2. 端口报错listen eaddrinuse:::xxx
  3. doctype是什么?
  4. angularjs $watch
  5. 实训九(游戏退出按钮的实现)
  6. CSS+JS鼠标悬停单元格变色
  7. 云计算背后的秘密(3)-BigTable
  8. [转载]对复旦食堂的印象
  9. 怎么安装python的包_python下如何安装.whl包?
  10. c++矩阵作为函数输入变量_C++实现矩阵乘法