贾浩楠 发自 凹非寺
量子位 报道 | 公众号 QbitAI

机器学习工程师岗位,还香吗?

在培训机构或求职网站随便一搜,机器学习简直不要更热。

但是,国外的同行们却在一则Reddit热帖上,吐槽揭露ML工程师“表面光鲜,实际搬砖”的一面。

说出了培训机构不会告诉你的机器学习业内真相。

那这些“过来人”怎么掉进一个个暗坑的?他们的经历对你有什么警醒借鉴的意义呢?

机器学习岗,怎样避免沦为数据标注师

Reddit热帖下,网友们吐槽最多的,就是学习和工作的巨大差距产生的幻灭感

学了一大堆牛X高大上的理论知识,以为自己能上手酷炫的神经网络,调参、训练、部署一条龙,但实际上,这些内容大概只占全部工作的10%-20%。

而且在一些团队中,会有专门的岗位来负责这些工作。

其余大部分人的职责是收集数据、给数据打标签、处理数据质量,或者用Python写基础架构。

当年梦中的那个引领AI潮流的少年,就这样成了数据标注师。

但是,网友也承认这一点确实是业内的普遍现象。而且,刚刚工作的新手,从低层技术开始做起,也是符合常理的。

大家的建议是:面对这种大量重复劳动,先别急着上手,去查一查资料,很多类似工作已经有成熟快速的方法。

当你跨过了基础工作这一关,要面对的,是ML项目中可能出现的各种令人头疼的问题,而这,是考验你能否成为优秀机器学习工程师的重要挑战。

机器学习之路布满荆棘

哪些在工作岗位上很重要的东西,是机器学习教程不会教你的?

网友们总结了最重要的4条:

正确认识业务
处理凌乱的现实世界数据集
工程导向,而不是在Jupyter Notebooks中编写研究代码
可视化

这些都是网友们在工作经历中吃了很多亏后,总结出的经验。

比如,很多ML工程师只有给定一个抽象化的问题才能上手,缺乏应对实际工程问题的能力。

而一个合格的、被业内广范认可的机器学习工程师,他可能并不精通算法的数学原理,而是能够在约束条件众多的实际情况下应用算法解决问题。

比如,在很多情况下,普通的旧算法(例如K-Means,高斯混合的EM等)非常有用。烧GPU并不是唯一办法

避免纸上谈兵,这是机器学习算法工程师正确认识业务的一部分,除此之外,重要的点还有合理的工期规划,和良好的沟通能力。

规划传统工程项目时,设定里程碑、期望值、是(相对)简单的。

但对于机器学习项目来说,在最初目标和前期阶段之后,很难给出具体的计划,因为变数实在太多了。

这就需要在项目初期阶段就保持头脑清醒,不要给自己挖坑,同时也要和boss以及同事说明沟通。

一位网友谈到了切身体会。他放弃了机器学习算法岗位,原因是老板根本不关心他为了完善算法细节付出了多少艰苦的劳动,只看最后的可视化效果。

当boss发现可视化效果并不高级时,认为他一直在浪费时间没好好工作。

所以,比其他软件工程师更强的抗错能力,也是你必备的。

如果你能抗过以上所有挫折和困难,还有艰难的一关要过。

机器学习业内的谎言

任何人都可以轻松成为数据科学家/机器学习工程师
软件工程师可以轻松成为数据科学家。
学习应用“现成库”就可以轻松上手搞AI。
搞AI无需学习高等数学/统计学
一种特定算法可以应用于任何领域并获得成功

这些,就是Reddit网友当年少不更事是信过“鬼话”、踩过的坑。

那么,真下决心走机器学习这条路,应该相信什么呢?

首先是要对行业现状有大致了解。

对于普通开发来说,机器学习岗位数量要比其他开发岗少很多。网友反映,在北美地区,100-150个后端开发的公司可能只有有2-5个搞AI的人。

其次,是很多有AI需求的公司没有必要的GPU等基础设施,你去了才发现只能使用免费的Collab。

从个人求职角度讲,ML项目大多很比较专,比较小众。你之前的项目经验,全国可能只有不多的几家公司感兴趣。

明白了这些,你还要清楚怎样正确地踏入机器学习的门。

多数有AI需求的公司,要求的是后端+DevOps+AI+前端这样的一体化岗位。这就需要你的全栈能力。

编写,测试,部署,在生产中跟踪模型、构建大规模数据是一个竞争力出众的机器学习工程师必备的。

而这些能力的基础要求,就是数学。

你当然不需要像搞科研那样精通数学。但扎实的高数、概率论、统计学基础必不可少。

对于有些培训课程打出的所谓不要求任何基础就上手AI的,Reddit网友直接说:“没有数学基础和过往编程经验的人,写出的代码是十分可怕的。”

大牛不仅仅止步于机器学习

当然,数学基础再好,代码写得再漂亮,也只是一个优秀的机器学习工程师。

真正的大佬,是不会止步于此的。

一位现在在搞神经科学的网友给出了独到的建议:

如果想做真正创新,有趣的工作,那么仅凭机器学习知识是不够的。还需要其他专业知识。

在特定环境中,清楚需要用那种ML算法来结解决问题,并且能高效处理数据,这样才能让你做出行业内独树一帜的先进成果。

以上就是Reddit机器学习社区的“过来人”给大家的忠告。

参考链接&传送门

Reddit热议贴
https://www.reddit.com/r/MachineLearning/comments/ifn7ua/d_what_are_the_untold_truths_of_being_a_machine/

Reddit网友推荐:2021年最有价值的10本机器学习书
https://www.machineelearning.com/top-10-machine-learning-books-in-2021/

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

每天5分钟,抓住行业发展机遇

如何关注、学习、用好人工智能?

每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。

同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:

加入AI社群,与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

「表面光鲜,实则搬砖」,机器学习社区自嘲不为人知的AI工程师真相相关推荐

  1. 双足机器人的最新就业方向:波士顿动力机器人「进厂搬砖」了!

    来源丨机器之心 点击进入->3D视觉工坊学习交流群 Atlas灵活得像个人一样. 近日,一段波士顿动力机器人 Atlas 在「施工现场」搬运物体的视频火了. 视频中,高架上的工人师傅说自己忘了带 ...

  2. 「超级干货大放送」机器学习十二种经典模型实例

    目录 实例一:线性回归波士顿房价 实例二:KNN实现电影分类 实例三:基于线性回归预测波士顿房价 ​ 实例四:sklearn完成逻辑回归鸢尾花分类 实例五:支持向量机完成逻辑回归鸢尾花分类 实例六:使 ...

  3. 公开「处刑」!波士顿动力的搬砖机器人,私下竟「翻车」不断

    编辑 | 汽车人 点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 [导读]如何让一个机器人尴尬?波士顿动力发布Atlas失误集锦,全网围观机器人翻车的各种样子 ...

  4. 年终总结 | 在开源、博客和搬砖的路上砥砺前行「2020」

    2020年即将过去,在这个多灾多难的一年里,我似乎并没有受到太大的影响,开源项目的维护仍在继续,技术博客有空也上来更新几篇,该搬的砖依旧在搬,只不过换了个地儿搬而已. 如果用一句话来描述我的2020年 ...

  5. 专访清华AIR院长张亚勤:AI在疫情中很重要,但却很「表面」

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要10分钟 Follow小博主,每天更新前沿干货 编辑:LQ 转载自:新智元 [导读]AI在疫情中的表现能打几分?AI行业有多大泡沫?第四次工业 ...

  6. 「机器学习」机器学习算法优缺点对比(汇总篇)

    作者 | 杜博亚 来源 | 阿泽的学习笔记 「本文的目的,是务实.简洁地盘点一番当前机器学习算法」.文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的 ...

  7. 「ML 基础篇」机器学习概览

    文章目录 1. 什么是机器学习 2. 引入机器学习 3. 应用场景 4. 机器学习分类 4.1. 有无人类监督 4.2. 是否增量学习 4.3. 泛化方式 5. 主要挑战 6. 测试与验证 1. 什么 ...

  8. 2020年,那些「引爆」了机器学习社区的热门论文、库和基准

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:机器之心 2020 年出现了哪 ...

  9. 3人2周上线,2人1周上线,Solo明天上线!开发周期果然不能用搬砖模式计算......

    有10000块砖需要我们去搬,1个人1天可以搬1000块,那么总共要10天搬完.为了更快的完成任务,如果我们派10个人去一起搬砖,那么1天就可以搬完. 这个简单的道理,每个人都懂,如果要让事情做的话, ...

最新文章

  1. AVS 通信模块之HTTP2Transport
  2. vue 自定义组件 v-model双向绑定、 父子组件同步通信
  3. 北京内推 | 微软亚洲研究院MSRA STCA招聘多模态算法实习生
  4. apex 查询_加速器关联好司机下载器下载的apex
  5. 数据分析模型和工具_数据分析师工具包:模型
  6. 【OpenCV 例程200篇】36. 直角坐标与极坐标的转换
  7. centos7 mysql创建表_centos7下创建数据库和用户
  8. C#利用NI VAS采集图片
  9. 使用d3.v3插件绘制出svg图
  10. matlab矩阵指定行求和,在matlab中对矩阵元素求和的有效(最快)方法
  11. php 测试网站打开速度,JS如何测试目标网站的打开响应速度
  12. 删库跑路大全 删库跑路
  13. java简易计算器报告_JAVA实训报告简易计算器.doc
  14. java excel 导入 加校验_【JavaWeb】导入Excel并进行校验
  15. MOOS程序解析记录(6)uSimMarine解析1
  16. 第九章 SQL Server的简单应用
  17. 我国拟立法禁止大数据杀熟;工信部通报43款App违规整改不彻底丨钛晚报
  18. 学 Flutter 不理解 Widget/Element/Render 三棵树?啥也不是!
  19. [CANFD] 高波特率下收发器延时的处理机制-Transceiver delay compensation
  20. 革命性新疗法后 第三例艾滋病治愈病例可能出现了!

热门文章

  1. 是否可以在其范围之外访问局部变量的内存?
  2. 微信小程序----日期时间选择器(自定义精确到分秒或时段)
  3. docker应用到生产环境的前提
  4. nodejs 中on 和 emit
  5. 分布式配置管理--百度disconf搭建过程和详细使用
  6. Linux系统(一)文件系统、压缩、打包操作总结
  7. Linux多线程实践(3) --线程属性
  8. nagios部署安装中篇
  9. macOS解决sublime text3运行python3报:UnicodeEncodeError: 'ascii' codec can't encode characters in position
  10. java final bigd_【BigData】Java基础_常量