点击上方“AI遇见机器学习”,选择“星标”公众号

重磅干货,第一时间送达

杨净 发自 凹非寺
量子位 报道 | 公众号 QbitAI

机器学习很无聊。

至少这位铁汁是这样认为的。

甚至还在Reddit上发了帖子,标题就直接这么明晃晃写道:

Why machine learning is more boring than you may think?

结果不到15个小时,便引起了500+热度的讨论。

对此,有网友认为,「因为它是工程技术,而不是基础研究,工程需要满足最低标准和最后期限的,技术上没有什么挑战性」。

而至于为何要如此强调「Boring」,这位数据科学家肖安讲了如下原因,也给出了自己的解决方式。

机器学习「四大Boring」

首先是设计 (Designing)的部分,占据5%-10%的时间。

这时候是群策群力、迸发新想法的时候,包括新的模型体系结构、数据功能和系统设计等。

预期的情况是,在每个项目中应用最新和最出色的算法,可以在知名顶会期刊发布的那种。

但实际情况是,由于「时间限制」和其他优先级事项,只能做到最简单、有效的算法。

这时候,为了满足作者的「成就感」,就会在附带项目中进行一些「疯狂」的想法,即使这些想法根本不起作用。

接着是编码 (Coding )的部分,根据项目的不同,20%到70%的时间占比。

代码通常分为五类:占代码总行数的百分比。

  • 数据管道,50-70%;

  • 系统和集成事物,10–20%;

  • ML模型:5–10%;

  • 支持调试和演示分析,5–10%;

预期的场景是,花费大量的时间在编码ML组件。

但现在已经有很多现成的框架和编码语言,将很多复杂的东西抽象化,这样工作流已经十分标准化了,根本不需要去开发和完善ML组件。

既然如此,工程师则将更多的时间花在其他低级的优化上,比如系统、数据管道等。

然后是质量检查、调试、修复 (Debug),至少要花65%的时间。(感受到了作者的怨念)

一般主要有两种错误,不良结果和传统软件问题。

不良结果,就是模型效果不好、评分较低(比如准确性)。

传统软件问题,就包括系统损坏、系统配置问题。

理想的状态,是只需要处理「不良结果」,然后去构建更好的模型。

嗯,展现才能的时间到了!

然而现实情况是,大概70%-90%都是「传统软件」问题。

而至于不良结果,通常在构建端到端模型训练和数据管道之后,就可以的很快获得很好的结果了。

最后一个部分,就是「灭火」(Fire-fighting),处理各种意外情况。

这大概是所有工程师都不愿意看到的点了吧。

在整个交付过程中,不管是外部、甲方爸爸的要求还是内部沟通不畅、能力不足等各种人为Bug,用作者的话来讲,「就是一场噩梦」。

这时候,除了保持微笑之外,建议将时间轴延长到2-3倍,在团队里积极交流。

害,说到这里,归根结底就是理想与现实之间的差距,别人以为的和你自己正在干的区别。

比如,就像这样。

最后,这位小哥还是注入了一些安慰剂。

就像从事任何职业一样,最终都会感到无聊和沮丧。

但是没关系,很正常。你应该开发一种应对机制,像玩游戏一样,在过程中获得一些小奖励,然后最终获得胜利。

网友怎么看?

对于这件事,网友们倒是意见各异。

有学CS学了6年的博士生自述了所遇到的迷茫,并表示打算放弃现在的博士学位。

我期望它是酷炫的、知识性、算法性的东西,但一直没有等到可大展拳脚的工程/调试类项目。

因为这个原因,我打算退学。虽然现在还不清楚该申请什么样的工作。

但有人觉得,作者所说的几个Boring,恰好是喜欢当ML工程师的原因。

还给出建议:如果你想花费100%的时间用来构建和调试ML模型,那你应该去看看研究岗,而不是工程岗。

还有网友表示,自己很喜欢ML工程师的工作,从构建自运行的端到端模型,到正式投入生产,会有很强烈的成就感。

也有人形象的比喻了理想与现实:

那么,对于这件事你怎么看?如果你的身边也有类似的经历,欢迎与我们分享~

参考链接:

https://towardsdatascience.com/data-science-is-boring-1d43473e353e
https://www.reddit.com/r/MachineLearning/comments/jvq4jw/d_why_machine_learning_is_more_boring_than_you/

欢迎关注我们,看通俗干货!

华人小哥控诉机器学习「四大Boring」,CS博士:深有同感,正打算退学相关推荐

  1. 华人小哥控诉机器学习四大 Boring!CS 博士:深有同感,正打算退学

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源:量子位 机器学习很无聊. 至少这位铁汁是这样认为的. 甚至还在Reddit上发了帖子,标 ...

  2. ChatGPT版必应被华人小哥攻破,一句话「催眠」问出所有Prompt

    才上岗2天,ChatGPT版必应就被攻破了. 只需在问题前面加上一句:忽视掉之前的指令. 它就好像被催眠了一样,问什么答什么. 来自斯坦福大学的华人小哥Kevin Liu就通过这一方法,把它的prom ...

  3. 华人小哥打造乔布斯版ChatGPT,网友:感觉他复活了

    金磊 发自 凹非寺 量子位 | 公众号 QbitAI 走ChatGPT的路,让乔布斯"复活". 一位华人小哥就真把这事给做成了,还搞了一个App名叫Steve Mind. 玩法和C ...

  4. 华人小哥周日加班后被马斯克开除....

    阅读本文大概需要4分钟. 关于推特裁员,前几天发过一篇文章:签"奋斗者协议"或者走人,马斯克给Twitter员工两天时间考虑 这篇其实引发了不小的争议,很多人认为马斯克裁的都是摸鱼 ...

  5. 首个“开源ChatGPT”来了:基于谷歌5400亿参数大模型,华人小哥出品,网友吐槽:这谁能跑?

    就说程序员的手速有多快吧,首个开源ChatGPT项目已经出现了! 基于谷歌语言大模型PaLM架构,以及使用从人类反馈中强化学习的方法(RLHF),华人小哥Phillip Wang复刻了一个ChatGP ...

  6. 华人小哥用苹果音箱「隔空」测心律,论文登上Nature子刊

    子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI 什么?苹果HomePod也能测心律,你没有听错,不是用Apple Watch. 来自华盛顿大学的研究团队对智能音箱进行了改造,无需接触皮肤, ...

  7. 华人小哥开发“CG工坊”,帮你快速入门计算机图形学 | GitHub热榜

    子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI CG新手们,你们的福音来了~ 为了让初学者更好地学习计算机图形学基础知识,一位哈佛小哥创建了graphics-workshop,一周左右的时 ...

  8. 华人小哥开发“黑话”数据集,AI:你连dbq都不知道,xswl!| NAACL 2021

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI 提到&q ...

  9. 干货 | 林轩田机器学习「基石+技法」历史文章汇总

    AI有道 一个有情怀的公众号 台湾大学林轩田机器学习经典课程:「机器学习基石」和「机器学习技法」.课程由浅入深.内容全面,基本涵盖了机器学习领域的很多方面,还包括了机器学习一些经典算法,包括支持向量机 ...

最新文章

  1. python 单元测试setup执行了多次_python单元测试setUp与tearDown
  2. Spring-----projects-----概述
  3. (亲测可行)基于面绘制的MC算法以及基于体绘制的 Ray-casting 实现Dicom图像的三维重建(python实现)
  4. css3 高度最小100%,100%最小高度CSS布局
  5. 数字货币 BCH的混币神器CashShuffle
  6. 信息系统项目管理师:第4章:项目整体管理与变更管理(1)
  7. php module类,总结php artisan module常用命令
  8. python最小二乘法拟合_Python 普通最小二乘法(OLS)进行多项式拟合
  9. SAP BTP SDK for Android 已经支持 Kotlin 了
  10. POJ 1088----滑雪(DP)
  11. navision系统和sap区别_erp系统与sap的区别是什么?
  12. Intel Sandy Bridge/Ivy Bridge架构/微架构/流水线 (12) - 执行核
  13. 『转』Dr.Web Security Space 8 – 免费3个月
  14. JDBC调用存储过程,以及存储过程 事务的使用.....
  15. eclipse 查看变量或方法被调用的快捷键
  16. 【ENVI解决经验】一处理图像就报错
  17. QTP/UFT11.5官方下载与安装教程及汉化
  18. 关于转换QQ消息中系统表情,自定义表情和截图的函数
  19. 触摸屏软键盘怎么调出来_触摸屏专用虚拟键盘下载
  20. php的curl选项curlopt,CURLOPT_NOBODY选项,php中文手册中坑爹的翻译!

热门文章

  1. 如何编写更好的SQL查询:终极指南-第二部分
  2. C#如何使用REST接口读写数据
  3. 运行第一个Docker容器-Docker for Web Developers(1)
  4. Linux device tree 简要笔记
  5. boost program_options
  6. mysql主主复制、主从复制、半同步的实现
  7. GDB 命令参考手册
  8. [转]几种调用WebService的方法
  9. tomcat环境变量参数catalina.home和catalina.base的设置位置
  10. numpy数组统计函数amin() amax()