营长的一位转型AI的朋友,最近对营长抱怨,“走过的最远的路,就是机器学习过程中的弯路”,然后开始各种blablabla,从论文的坑,到模型的坑,再到培训的坑...一路吐槽。

2

尤其是论文,他骂道:“最讨厌的就是那种,高高在上、假装清高、站着说话不腰疼、戳不到痛点的论文。比如那一堆只能在理论中刷存在感,实际落地中只能‘呵呵哒’的论文,根本就是浪费时间。”

的确,对于现在刚刚入行的机器学习新人来说,不怕吃苦,但最怕走弯路,最怕白白浪费时间。

那么,总结起来,都有怎样的弯路呢?来看几位点赞量颇高的知乎答主的总结:

那些年,他们在机器学习中走过的弯路...

在知乎答主张馨宇(就职于百度地图)看来,机器学习的弯路有以下四个

最大的弯路就是自己xjb学xjb试,和加入一个真正能做出东西的团队或跟随真正的牛人一起学习相比,速度要慢十倍都不止。学是要学,但不要以为自己xjb学就够了,差得远呢。

第二大的弯路就是成天xjb看论文,以为这样就能打通任督二脉,从来不复现论文或者尝试自己做出一些东西,这都是〇。

第三大弯路浅尝辄止,有些东西不往死里怼屁都做不出来。

第四大弯路迷信复杂的东西和新技术,以为新东西怼上去肯定就效果爆棚。其实都是不存在的。

还有一位知乎答主ycszen,在他看来,最大弯路,就是迷信论文,不去实验

DLML其实是一门实践性的学科,只有通过实验才能把握到其中的细节与真谛。虽说也是在写程序,但是DL的程序基本上无法直观地debug,所以非得自己去复现一下,实践一下,用performance来说话,才知道有没有出错。

尤其是DL,研究发展到现在,论文和实际做的东西脱节已经是心照不宣的事了。正因为NN+GD的鲁棒性,你xjb搞好像也能搞上去,所以写论文很多纯粹在编故事(好论文除外)

所以,我们最好不要一味相信论文所说,尤其是各种解释(经典算法,优秀论文除外)。NN就是个黑盒,谁也别说谁。而我们能做的,更重要的是,去实践去复现,去去伪存真,去发现其中真正的本质所在。

而知乎答主:YukiRainCV/ML方向研究生在读)则认为,非科班出身,刚转型AI的程序员最大的弯路是:没学好数学

而对于数学基础好,科班出生的AI程序员来说,则应注意以下几个问题

1.一开始没人带的时候,看论文喜欢看最新的,很大程度上忽视了很多比较老比较基础的论文,嫌弃以前的方法performance不好什么的......感觉我身边一些人也走进过这个误区......

2.永远不要迷信某个特定的模型,不要因为random forest在某个任务上效果好,就以后遇到什么任务都上random forest;也不要觉得深度学习就是万能的,什么都可以套神经网络解决;不要看到比赛里面大家整天用xgboost就整人云亦云地复制。学各种算法的时候,书上一般会告诉你这个算法有balabala优点一堆,但是一般不会告诉你这个算法也有balabala一堆缺点,我花了蛮长时间在这个坑里,慢慢摸索各种不同模型的特性。

3. 不要迷信一些理论性很强的论文,我一开始的时候,经常看到一大堆公式就下意识会觉得这个模型可能效果不错。事实上很多论文的理论推导和它的代码毫无关联(参见已经彻底回归炼丹的WGAN GP),还有很多论文的推导需要很强的assumption支持(参见每年都会出现在顶会的一些给模型加riemannian geometry的论文),等等。

那么面对这些弯路,又应该如何解决呢?

那就是走正统的教育路线,你follow的人一定是真正做事情的人。机器学习还没有达到批量化流水生产的阶段,因此一个好的“老师傅”比自学效果好很多。不仅如此,老师傅们一般都有自己多年经验总结出来的经验,往往可以避免很多不必要弯路。目前机器学习的资料有很多,动辄就有几个G的材料可以下载或者观看。而很多朋友都有“收集癖”,一下子购买十几本书的人我也常常能够看到。而机器学习的发展和变化速度很快,在入门期间,建议“小而精”的选择资料。这不仅可以节约重复学习的时间,也可以读有品位的材料。

为了防止我们走更多的弯路,小象给我们提供了一个follow大牛的机会,帮助我们强化机器学习中需要的数学基础知识,深入理解经典算法的数学原理,不仅可以掌握工业界广泛应用的机器学习模型,还会培养用机器学习解决问题的思路。

《机器学习》全新升级版Ⅲ

原价     ¥ 899.00

现超 400 人参团

仅售     ¥ 399.00 

点击文末阅读原文立即参团

课程详情

参团,咨询,查看课程,请点击【阅读原文】

↓↓↓

你走过最长的路 ,就是机器学习过程中的弯路相关推荐

  1. 心得丨走过最长的路,就是机器学习过程中的弯路

    营长的一位转型AI的朋友,最近对营长抱怨,"走过的最远的路,就是机器学习过程中的弯路",然后开始各种blablabla,从论文的坑,到模型的坑,再到培训的坑...一路吐槽. 尤其是 ...

  2. 你走过最长的路,就是机器学习过程中的弯路

    营长的一位转型AI的朋友,最近对营长抱怨,"走过的最远的路,就是机器学习过程中的弯路",然后开始各种blablabla,从论文的坑,到模型的坑,再到培训的坑...一路吐槽. 尤其是 ...

  3. 新手如何避开机器学习过程中的弯路

    一位转型AI的朋友最近抱怨,"走过的最远的路,就是机器学习过程中的弯路",然后开始各种blablabla,从论文的坑,到模型的坑,再到培训的坑...一路吐槽. 尤其是论文,他骂道: ...

  4. 我走过最长的路,就是XMX的套路

    币圈有两大不为发币而做区块链的英雄,一个是三点钟创始人玉红,一个是快的打车创办者陈伟星,一个直呼"搞区块链要发币是误区,很多人跑偏了",一个大喊"一些币圈大佬割韭菜手段太 ...

  5. 最全消费者防坑手册:走过最长的路,就是商家的套路

    远离消费陷阱,提升消费体验,黑猫投诉平台全天候服务,您的每一条投诉,都在改变这个世界.[投诉,就上黑猫] 最全消费者防坑手册:你走过最长的路,就是商家的套路 来源:21世纪经济报道 21财经APP 杨 ...

  6. JAVA开发需求分析套路_需求分析:我走过最长的路,就是需求的套路

    面对千变万化的需求,也许很难抽象出一套普适的方法论,不妨一起来看看需求分析过程中的那些常见套路,或许能有一些值得借鉴和思考. "我走过最长的路,就是需求的套路."-- 某PM前辈 ...

  7. 走过最长的路是你的套路

    走过最长的路是你的套路(PS调色) 不管是刚初入ui设计和VR动画的小白,调色是很重要的某部分技术,我给大家讲下这里面的套路-ps调色 1.亮度对比度(图像/ 调整/ 亮度对比度命令) 亮度是指画面的 ...

  8. 机器学习过程中的数据预处理和特征选择方法

    1.数据清洗 数据清洗(data cleaning)是在机器学习过程中一个不可缺少的环节,其数据的清洗结果直接关系到模型效果以及最终的结论.在实际的工作中,数据清洗通常占开发过程的50%-80%左右的 ...

  9. 校招那些坑,是我走过最长的路

    专栏 | 九章算法 网址 | http://www.jiuzhang.com <北大胡呜昂分享一年求职悲欢,带****你避开校招的坑>讲座整理 在校招过程中,你可能会遇到许多的坑,使得你和 ...

最新文章

  1. MS IME 2007输入法
  2. Java子线程中的异常处理(通用)
  3. 做一个项目,平时都用到哪些工具提高效率(上)
  4. IBM押注沃森人工智能技术 未来6年或达170亿美元
  5. 顺序三元组 java_三元组顺序结构实现稀疏矩阵相加,行序优先(Java语言描述)
  6. 读取Apache访问日志,查看每一个独立客户端连接获得的字节数
  7. JDK8-废弃永久代(PermGen)迎来元空间(Metaspace)
  8. 连续arq协议的利用率_Chrome底层原理和HTTP协议 - 石吴玉
  9. 钢琴块2电脑版_包租婆租赁合同管理系统电脑版|包租婆租赁合同管理系统PC版下载_v10.3.5.2...
  10. 【T+】余额表联查明细账,提示未将对象引用设置到对象的实例;参数格式错误,solutionID不能为空。
  11. Spring系列七:JDK 动态代理和 CGLIB 代理
  12. jmeter 生成随机数(手机号)随机中文字符
  13. java 图片格式判断_Java判断文件是否为图片
  14. r语言算巢式设计方差分析_R语言学习笔记(七):方差分析
  15. 计算机word格式,2017年职称计算机Word教程:Word段落格式
  16. 弘辽科技:淘宝卖家修改标题的注意事项有哪些?如何预防被降权?
  17. 成功失败算法matlab_如果将所有内容留给算法,为什么我们会失败
  18. Linux中,常常会用到 vim ,其中 q ,wq wq!的区别,以及 vim -r 的作用
  19. 解决 Windows 11 记事本崩溃闪退
  20. linux中的ens33配置

热门文章

  1. 惠普g260鼠标宏软件_黑爵电竞鼠标AJ337 电竞手残党福音 鼠标宏一键火力全开
  2. 软件工程课, 编程课 助教的工作介绍
  3. 用积分来衡量博客的成绩
  4. python 3.7.732位安装步骤_Python3.7安装pyaudio教程解析
  5. 40个Java 多线程问题总结
  6. 学习Java编程-Java Timezone类常见问题
  7. java 二进制文件 数据库_java从数据库中读取二进制文件并....
  8. java jdbc mysql 乱码_【求助】为什么用纯java jdbc插入mysql一直乱码
  9. java spring hiberate_Java程序员:Spring Boot和Hibernate一起使用的技巧
  10. vs xaml 语句完成 自动列出成员_数据传输 | mysqldiff/mysqldbcompare 实现 DTLE 自动化测试...