本文授权转载自公众号“算法圈的小破事”,点击以上卡片进行关注

大家好,我是在互联网危险边缘疯狂试探的皮皮虾。

最近有点忙,拖更了,不知道有没有读者惦记皮皮虾推文呢(目测没有TT)。

首先祭出新华字典的老图镇文:

事情是这样的,最近有个大四的读者加了皮皮虾微信,说自己在困惑读研方向选择的问题:“导师是做CV的,但自己看了知乎的一些回答后又想做NLP了。”问皮皮虾有没有必要尝试换方向换导师。

皮皮虾知乎刷的不太多,但也听说了知乎劝入搜推广,硕士选择NLP就是半只脚踏进了搜推广,云云。皮皮虾觉得这其实是比较片面的观点。所以今天就来谈一谈,做CV和做NLP,是否都有光明的未来?

从学术研究的角度来说,其实两者都没有问题。

但近两年在工业界搞科研是越来越不受待见了,学术大牛出走AI lab已经不是什么大新闻了。如果对CV或NLP技术抱有很大的技术热忱,一心只想搞研究,皮皮虾还是比较建议读博后去混学术界。

不过对大部分人来说,硕士期间选择CV或NLP只是暂时的,毕业后大都要进互联网做业务的。这就引申出来一个问题:我们在互联网行业都有光明的未来吗?如果放在多年前,我觉得这个问题还真不一定。当时CV的对口互联网场景特别少,甚至流传CV人去互联网就是去做美图秀秀的夸张说法。

而NLP技术与互联网的搜索、推荐业务关联比较大,容易进入互联网的核心赛道。近些年来,无论是CV还是NLP技术,对口的业务赛道都比几年前丰富了很多。互联网的生意模式整体上可以分为:

  1. 面向终端消费者(To Customer,ToC)

  2. 面向企业客户(To Business,ToB)

  3. 面向政府客户(To Government,ToG)

我们所熟知的电商、搜索、信息流、短视频、游戏、社交等,就是典型的ToC业务。而云计算、AI类的业务,则同时涵盖了ToB和ToG。

先来说说ToC。不少人吹NLP就是因为NLP技术能轻松切入到主流的ToC业务赛道。比如NLP中的文本匹配、标题理解、内容理解技术,在电商搜索、电商推荐、商品理解、搜索相关性、网页/信息流内容理解等场景十分适用,甚至常常作为支撑技术。

而对CV来说,早些年对口的互联网生意主要聚焦在ToB和ToG上。ToC则主要应用在图像处理软件如美图秀秀,相机类应用中。在搜索、推荐、广告场景,CV技术也有应用,例如图像搜索、广告图片OCR等,但对于业务全局来说,往往特征的权重比较低,影响范围比较有限。

而皮皮虾开头说过,CV技术ToC的事情放在2022年,就不一样了。

近年来,随着新能源产业的强势崛起,自动驾驶成为热门赛道,大量资本、巨头涌入。而从计算机视觉技术进入这个新兴赛道无疑是水到渠成的。

若这块业务和技术能持续稳定发展,若干年后切实落地,那一个新的万亿规模的赛道便诞生了。

即便不用等到自动驾驶全面落地开花,哪怕是当下,就在搜推广传统业务内卷的叫苦不迭的时候,自动驾驶赛道的算法人才不仅薪资水涨船高,而且稀缺,距离饱和、内卷还有一段距离。

从个体的角度出发,这也是CV人择业的一个时代优势。当然,既然是新业务,自然也有出意外的可能。那便是技术始终无法满足体验的预期,也始终没有找到一个折中的退路,凉了。这便谁也说不准了。不过目前来看,无论国家政策、资本信心还是技术的更新换代,都还在持续向着好的方向发展,实现真·自动驾驶也是全人类的一个美好愿景,我们还是选择相信明天吧。

除了自动驾驶外,像最近比较火的视频搜索、元宇宙/VR应用、体感游戏等新场景,CV技术也将发挥出重要价值,甚至成为其中的核心技术。

再来说说ToB和ToG。

在这方面,CV不仅商业化空间比NLP要大,而且更重要的是容易做到标品化。例如安防领域,火车站、机场的闸机人脸识别,物流、快递面单OCR识别等,都属于量大、传统行业难以投入研发且AI技术企业相对容易做标品化。

标品化就意味着一套解决方案可以在多家重复应用,边际成本可以控制的很低,这是ToB和ToG能够赚大钱的前提。

而NLP在ToB和ToG方面推进阻力比较大,最大的问题就是同样一个NLP任务,在不同的业务方手里往往有不同的产品定义。

例如同样是智能客服,在银行业的客服跟在航空公司的客服,显然业务逻辑有着相当大的差别,从运营的产品概念实体到对话逻辑,都需要做差异化的定制。

即,基本不可能打造出一套通用的对话系统,哪怕同面向银行客户,建设银行跟农业银行的产品逻辑都无法平行复制。

无法标品化,就意味着只能让算法RD一个订单一个订单的啃,边际成本始终降不下来,赚不到大钱。

归根结底,CV、Speech是感知层面的任务,有一套大自然定义的客观标准,而NLP是认知层面的任务,由人去创造的标准,自然就会千变万化难以客观统一。

联想到近些年NLP领域“小样本”的研究越来越火,皮皮虾盲猜也跟企业AI ToB对标品化、边际成本控制的疯狂渴望有关。

最后总结一下。

无论CV还是NLP,2022年的业务出口都相对几年前宽敞了很多。NLP的ToC出口大,赛道核心,比较稳定,但ToB/ToG的空间目前还比较有限;CV的ToC出口小,赛道新,风险与机遇同在,但ToB/ToG的天花板更高。

一句话:我们都有光明的未来。

最后留个尾巴,皮皮虾近期想写一篇“ToC和ToB业务对个体职业生涯的影响”,感兴趣的读者请把1打在评论区~

本文授权转载自公众号“算法圈的小破事”,点击以上卡片进行关注~

后台回复关键词【入群

加入卖萌屋NLP、CV与搜推广求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

做CV和做NLP,是否都有光明的未来?相关推荐

  1. 一个既能做CV任务,也能做NLP任务的Transformer模型!谷歌UCLA提出统一的基础模型...

    关注公众号,发现CV技术之美 本文分享论文『Towards a Unified Foundation Model: Jointly Pre-Training Transformers on Unpair ...

  2. Smarter公众号做CV界最优质的内容输出(16人银河战舰)

    Smarter交流群 Smarter开白&合作&内推 内推注明: 昵称-内推 交流群注明: 交流群-昵称-学校/公司-方向 开白&合作注明: 昵称-目的 目前16人银河战舰! ...

  3. #今日论文推荐# 用GNN做CV三大任务的新骨干,同计算成本性能不输CNN、ViT与MLP|中科院华为诺亚开源

    #今日论文推荐# 用GNN做CV三大任务的新骨干,同计算成本性能不输CNN.ViT与MLP|中科院&华为诺亚开源 用图神经网络(GNN)做CV的研究有不少,但通常是围绕点云数据做文章,少有直接 ...

  4. UI设计要做什么,UI设计培训都要学什么

    UI设计要做什么,UI设计培训都要学什么?相信有很多人都对这个问题比较感兴趣,近几年,UI设计被越来越多的人关注,行业薪资水平也是一路飙升,很多人都在准备学习UI设计,那么具体的内容,下面我们来看看详 ...

  5. 让大家信任自己,做个行为和语言上都没黑盒子的技术人员(转)

    在汽车之家工作了 10 年,如今创业也有 6 个月了,身边流经了上百人的技术朋友,和他们一起战斗.一起创业.看着他们离职.看着他们不开心. 原因是啥? 最原始状态就是:不被信任. 写代码的技术是个很独 ...

  6. 事情永远做不完,却什么都带不走

    事情永远做不完,却什么都带不走 ------------------------------------------------ 以下为转载: 台湾最美丽的董事长 - 101大楼董事长 陈敏熏 一定要 ...

  7. 你做的数据运营,90%都是无用功

    本文根据张明明老师在[deeplus直播第256期]线上分享演讲内容整理而成.(文末有回放的方式,不要错过) 张明明 <数据运营之路:掘金数据化时代>作者 美菜网 策略规划中心 负责人 1 ...

  8. 近视手术,是福音还是噩梦,知道这些危害,你还敢做吗,眼科小知识都在这里

    Hi,大家好,这是一篇非技术性文章,这篇主要想介绍激光近视手术的危害,让每个想做近视手术的朋友心里有个预期,当然这些问题发生的概率可能很小,但是落在你身上就是 100%,请看完之后在决定是否做手术. ...

  9. 做你想做的人,这件事,没有时间的限制,只要愿意,什么时候都可以开始

    现代人的生活节奏都很快,很多时候,没办法拿出整块的时间来阅读和学习.而我则是那个喜欢阅读的人,我愿意通过我的阅读,挑选或者总结归纳一些精美的句子,分享给大家,希望能给你带来支持和力量. 哪怕是心灵鸡汤 ...

最新文章

  1. 鼠标跟随flash代码_FLASH如何制作密码锁功能(AS3)
  2. SQL Server 2008中原生的分层数据类型:hierarchyid
  3. 网站站内优化新方案,SEO运营人员值得一看
  4. Resource stopwords not found. Please use the NLTK Downloader to obtain the r
  5. JAVA项目怎么不是蓝色_解决IDEA创建maven项目时pom.xml没有变蓝的问题
  6. office如何快速删除重复数据
  7. java中后退键_java - 单击后退按钮两次以退出活动
  8. MVVM下listbox默认显示最后一行
  9. [单选题]对下面的表达式描述正确的是: (T/t)(M/m)
  10. 数组分割问题(转载学习)
  11. 9000个网站、APP、社交网站真实用户头像打包
  12. Java集合常见面试题集锦
  13. 【车牌识别】基于模板匹配算法实现车牌识别matlab源码
  14. android打飞机游戏、MVP句子迷App、悬浮窗、RxJava+Retrofit、加载动画、定制计划App等源码
  15. Android Studio将本地计算机文件上传到模拟器scard文件中,显示不出
  16. 雅虎网宣布将关闭“站长天下”服务功能
  17. Xshell连接服务器
  18. 问题-百度云同步盘登陆时提示155010错误
  19. 3D 环视系统碗状模型绘制
  20. wps 根据单元格值 设置单元格所在行 颜色(大于0 行红色 小于0 行xx色)

热门文章

  1. shell:读取文件的每一行内容并输出
  2. SQL Server定期自动备份
  3. boost学习之boost::lock_guard源码分析
  4. 深度:关于Linux内核最硬核的文章
  5. android加号底部导航栏,EasyNavigation Android 底部导航栏████几行代码实现 Tab 导航(随意定制加号,带红点消息提示) @codeKK Android开源站...
  6. python价值观测试程序例子_PyBrains学习迷宫的例子。国家价值观与全球政策
  7. jsp人事管理系统_Jsp+Ssm+Mysql实现的医院人事管理系统源码附带视频运行教程
  8. python 爬虫是什么_“python爬虫“是什么呢?
  9. 【Pytorch神经网络实战案例】14 构建条件变分自编码神经网络模型生成可控Fashon-MNST模拟数据
  10. 十六、PHP框架Laravel学习笔记——构造器的增删改