「表面光鲜,实则搬砖」,机器学习社区自嘲不为人知的AI工程师真相
贾浩楠 发自 凹非寺
量子位 报道 | 公众号 QbitAI
机器学习工程师岗位,还香吗?
在培训机构或求职网站随便一搜,机器学习简直不要更热。
但是,国外的同行们却在一则Reddit热帖上,吐槽揭露ML工程师“表面光鲜,实际搬砖”的一面。
说出了培训机构不会告诉你的机器学习业内真相。
那这些“过来人”怎么掉进一个个暗坑的?他们的经历对你有什么警醒借鉴的意义呢?
机器学习岗,怎样避免沦为数据标注师
Reddit热帖下,网友们吐槽最多的,就是学习和工作的巨大差距产生的幻灭感。
学了一大堆牛X高大上的理论知识,以为自己能上手酷炫的神经网络,调参、训练、部署一条龙,但实际上,这些内容大概只占全部工作的10%-20%。
而且在一些团队中,会有专门的岗位来负责这些工作。
其余大部分人的职责是收集数据、给数据打标签、处理数据质量,或者用Python写基础架构。
当年梦中的那个引领AI潮流的少年,就这样成了数据标注师。
但是,网友也承认这一点确实是业内的普遍现象。而且,刚刚工作的新手,从低层技术开始做起,也是符合常理的。
大家的建议是:面对这种大量重复劳动,先别急着上手,去查一查资料,很多类似工作已经有成熟快速的方法。
当你跨过了基础工作这一关,要面对的,是ML项目中可能出现的各种令人头疼的问题,而这,是考验你能否成为优秀机器学习工程师的重要挑战。
机器学习之路布满荆棘
哪些在工作岗位上很重要的东西,是机器学习教程不会教你的?
网友们总结了最重要的4条:
正确认识业务
处理凌乱的现实世界数据集
工程导向,而不是在Jupyter Notebooks中编写研究代码
可视化
这些都是网友们在工作经历中吃了很多亏后,总结出的经验。
比如,很多ML工程师只有给定一个抽象化的问题才能上手,缺乏应对实际工程问题的能力。
而一个合格的、被业内广范认可的机器学习工程师,他可能并不精通算法的数学原理,而是能够在约束条件众多的实际情况下应用算法解决问题。
比如,在很多情况下,普通的旧算法(例如K-Means,高斯混合的EM等)非常有用。烧GPU并不是唯一办法。
避免纸上谈兵,这是机器学习算法工程师正确认识业务的一部分,除此之外,重要的点还有合理的工期规划,和良好的沟通能力。
规划传统工程项目时,设定里程碑、期望值、是(相对)简单的。
但对于机器学习项目来说,在最初目标和前期阶段之后,很难给出具体的计划,因为变数实在太多了。
这就需要在项目初期阶段就保持头脑清醒,不要给自己挖坑,同时也要和boss以及同事说明沟通。
一位网友谈到了切身体会。他放弃了机器学习算法岗位,原因是老板根本不关心他为了完善算法细节付出了多少艰苦的劳动,只看最后的可视化效果。
当boss发现可视化效果并不高级时,认为他一直在浪费时间没好好工作。
所以,比其他软件工程师更强的抗错能力,也是你必备的。
如果你能抗过以上所有挫折和困难,还有艰难的一关要过。
机器学习业内的谎言
任何人都可以轻松成为数据科学家/机器学习工程师
软件工程师可以轻松成为数据科学家。
学习应用“现成库”就可以轻松上手搞AI。
搞AI无需学习高等数学/统计学
一种特定算法可以应用于任何领域并获得成功
这些,就是Reddit网友当年少不更事是信过“鬼话”、踩过的坑。
那么,真下决心走机器学习这条路,应该相信什么呢?
首先是要对行业现状有大致了解。
对于普通开发来说,机器学习岗位数量要比其他开发岗少很多。网友反映,在北美地区,100-150个后端开发的公司可能只有有2-5个搞AI的人。
其次,是很多有AI需求的公司没有必要的GPU等基础设施,你去了才发现只能使用免费的Collab。
从个人求职角度讲,ML项目大多很比较专,比较小众。你之前的项目经验,全国可能只有不多的几家公司感兴趣。
明白了这些,你还要清楚怎样正确地踏入机器学习的门。
多数有AI需求的公司,要求的是后端+DevOps+AI+前端这样的一体化岗位。这就需要你的全栈能力。
编写,测试,部署,在生产中跟踪模型、构建大规模数据是一个竞争力出众的机器学习工程师必备的。
而这些能力的基础要求,就是数学。
你当然不需要像搞科研那样精通数学。但扎实的高数、概率论、统计学基础必不可少。
对于有些培训课程打出的所谓不要求任何基础就上手AI的,Reddit网友直接说:“没有数学基础和过往编程经验的人,写出的代码是十分可怕的。”
大牛不仅仅止步于机器学习
当然,数学基础再好,代码写得再漂亮,也只是一个优秀的机器学习工程师。
真正的大佬,是不会止步于此的。
一位现在在搞神经科学的网友给出了独到的建议:
如果想做真正创新,有趣的工作,那么仅凭机器学习知识是不够的。还需要其他专业知识。
在特定环境中,清楚需要用那种ML算法来结解决问题,并且能高效处理数据,这样才能让你做出行业内独树一帜的先进成果。
以上就是Reddit机器学习社区的“过来人”给大家的忠告。
参考链接&传送门
Reddit热议贴
https://www.reddit.com/r/MachineLearning/comments/ifn7ua/d_what_are_the_untold_truths_of_being_a_machine/
Reddit网友推荐:2021年最有价值的10本机器学习书
https://www.machineelearning.com/top-10-machine-learning-books-in-2021/
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
每天5分钟,抓住行业发展机遇
如何关注、学习、用好人工智能?
每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。
同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:
加入AI社群,与优秀的人交流
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !
「表面光鲜,实则搬砖」,机器学习社区自嘲不为人知的AI工程师真相相关推荐
- 双足机器人的最新就业方向:波士顿动力机器人「进厂搬砖」了!
来源丨机器之心 点击进入->3D视觉工坊学习交流群 Atlas灵活得像个人一样. 近日,一段波士顿动力机器人 Atlas 在「施工现场」搬运物体的视频火了. 视频中,高架上的工人师傅说自己忘了带 ...
- 「超级干货大放送」机器学习十二种经典模型实例
目录 实例一:线性回归波士顿房价 实例二:KNN实现电影分类 实例三:基于线性回归预测波士顿房价 实例四:sklearn完成逻辑回归鸢尾花分类 实例五:支持向量机完成逻辑回归鸢尾花分类 实例六:使 ...
- 公开「处刑」!波士顿动力的搬砖机器人,私下竟「翻车」不断
编辑 | 汽车人 点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 [导读]如何让一个机器人尴尬?波士顿动力发布Atlas失误集锦,全网围观机器人翻车的各种样子 ...
- 年终总结 | 在开源、博客和搬砖的路上砥砺前行「2020」
2020年即将过去,在这个多灾多难的一年里,我似乎并没有受到太大的影响,开源项目的维护仍在继续,技术博客有空也上来更新几篇,该搬的砖依旧在搬,只不过换了个地儿搬而已. 如果用一句话来描述我的2020年 ...
- 专访清华AIR院长张亚勤:AI在疫情中很重要,但却很「表面」
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要10分钟 Follow小博主,每天更新前沿干货 编辑:LQ 转载自:新智元 [导读]AI在疫情中的表现能打几分?AI行业有多大泡沫?第四次工业 ...
- 「机器学习」机器学习算法优缺点对比(汇总篇)
作者 | 杜博亚 来源 | 阿泽的学习笔记 「本文的目的,是务实.简洁地盘点一番当前机器学习算法」.文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的 ...
- 「ML 基础篇」机器学习概览
文章目录 1. 什么是机器学习 2. 引入机器学习 3. 应用场景 4. 机器学习分类 4.1. 有无人类监督 4.2. 是否增量学习 4.3. 泛化方式 5. 主要挑战 6. 测试与验证 1. 什么 ...
- 2020年,那些「引爆」了机器学习社区的热门论文、库和基准
点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:机器之心 2020 年出现了哪 ...
- 3人2周上线,2人1周上线,Solo明天上线!开发周期果然不能用搬砖模式计算......
有10000块砖需要我们去搬,1个人1天可以搬1000块,那么总共要10天搬完.为了更快的完成任务,如果我们派10个人去一起搬砖,那么1天就可以搬完. 这个简单的道理,每个人都懂,如果要让事情做的话, ...
最新文章
- AVS 通信模块之HTTP2Transport
- vue 自定义组件 v-model双向绑定、 父子组件同步通信
- 北京内推 | 微软亚洲研究院MSRA STCA招聘多模态算法实习生
- apex 查询_加速器关联好司机下载器下载的apex
- 数据分析模型和工具_数据分析师工具包:模型
- 【OpenCV 例程200篇】36. 直角坐标与极坐标的转换
- centos7 mysql创建表_centos7下创建数据库和用户
- C#利用NI VAS采集图片
- 使用d3.v3插件绘制出svg图
- matlab矩阵指定行求和,在matlab中对矩阵元素求和的有效(最快)方法
- php 测试网站打开速度,JS如何测试目标网站的打开响应速度
- 删库跑路大全 删库跑路
- java简易计算器报告_JAVA实训报告简易计算器.doc
- java excel 导入 加校验_【JavaWeb】导入Excel并进行校验
- MOOS程序解析记录(6)uSimMarine解析1
- 第九章 SQL Server的简单应用
- 我国拟立法禁止大数据杀熟;工信部通报43款App违规整改不彻底丨钛晚报
- 学 Flutter 不理解 Widget/Element/Render 三棵树?啥也不是!
- [CANFD] 高波特率下收发器延时的处理机制-Transceiver delay compensation
- 革命性新疗法后 第三例艾滋病治愈病例可能出现了!
热门文章
- 是否可以在其范围之外访问局部变量的内存?
- 微信小程序----日期时间选择器(自定义精确到分秒或时段)
- docker应用到生产环境的前提
- nodejs 中on 和 emit
- 分布式配置管理--百度disconf搭建过程和详细使用
- Linux系统(一)文件系统、压缩、打包操作总结
- Linux多线程实践(3) --线程属性
- nagios部署安装中篇
- macOS解决sublime text3运行python3报:UnicodeEncodeError: 'ascii' codec can't encode characters in position
- java final bigd_【BigData】Java基础_常量