干货丨深度学习究竟怎么入门?两位Google大神掀起剑气之争
作为一名(华山派新弟子)深度学习新手,该先学会用框架快速搭出神经网络,用到实际问题中去,还是该先练习用Python基本徒手搭建模型,在小数据集上训练,了解它们的工作原理?
谷歌的两位研究员最近在Twitter上展开了一场旷日持久的争论,两派主要代表都是圈子里大名鼎鼎颇有建树的人物:
“气宗”代表 谷歌大脑的研究员David Ha(@hardmaru),SketchRNN的爸爸。
“剑宗”代表 谷歌研究员François Chollet(@fchollet),Keras的爸爸。
注: “气宗”“剑宗”无任何道德、派系等层面的影射,不要多心
剑气之争
这两位所争论的问题,正是 内力和剑法哪个更重要 深度学习新手的入门路径问题:了解模型的内部原理,和快速实现模型解决问题,哪个更重要呢?
量子位越洋围观了这场辩论,觉得他们的观点很值得搬回来让大家了解、思考一下。
在David Ha看来,想搞好深度学习,当然要先打基础,“练气”很重要。他在一个月前抛出了这样一个观点:
从零开始(用纯Python、numpy、甚至JS)实现全连接网络、卷积神经网络、RNN、反向传播、SGD,然后用小训练集来训练这些模型是一种学习神经网络如何工作的好方法。在跳到框架上之前,应该花时间从这里收获宝贵的直觉力。
新手入门,难道不该用最简单的高层框架吗?Keras作者Chollet就更支持初学者们先“练剑”。他对David的反驳是这样的:
实现神经网络能教你怎样实现神经网络,让你从算法上理解它们的工作原理。
但这不能教会你它们是做什么的,或者说能否实现哪些功能。要学习这些,你应该把它们应用到一系列真实问题上去(而不是XOR、MNIST)。
究竟谁更有道理?两位过招七八条Twitter,来详细论证自己的观点,看完再选适合你的方法也不迟。
以气驭剑
徒手搭模型,拿MNIST这样的小数据集、甚至XOR来琢磨其中奥妙,显然不是速成之法。那么,花这么多时间“打坐练气”的意义何在?
追求的,当然是一个以气驭剑。
David Ha说,深度学习框架都是些样板化的模型,入门就用框架,会限制眼界,让你泯然众人。
从零开始徒手搭模型就不一样了,对于那些跨行业入门深度学习的人来说,有机会从自己的独特视角,看到大多数人忽略的东西。
“气宗”不止David一人。李飞飞的得意门生、现任特斯拉AI总监的Andrej Karpathy也表达过类似观点。
他在斯坦福CS231n课上就要求学生将神经网络的向前和向后传递都用numpy实现一遍。学生当然有意见:拿个框架就能自动算的东西,我为什么要徒手来搭?
最重要的原因是,徒手将向前和向后传递都实现一遍才能真正理解其中的工作原理。如果单纯依赖框架的自动计算,在反向传播出现问题时就无法应对。
干货丨深度学习究竟怎么入门?两位Google大神掀起剑气之争相关推荐
- 深度学习究竟怎么入门?两位Google大神掀起剑气之争
本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处 本文约2000字,建议阅读5分钟. AI界气宗和剑宗大佬争论新手入门AI哪个路径比较好呢? 作为一名深度学习新手,该先学会 ...
- 干货丨深度学习、图像分类入门,从VGG16卷积神经网络开始
刚开始接触深度学习.卷积神经网络的时候非常懵逼,不知道从何入手,我觉得应该有一个进阶的过程,也就是说,理应有一些基本概念作为奠基石,让你有底气去完全理解一个庞大的卷积神经网络: 本文思路: 一.我认为 ...
- 干货丨深度学习初学者必读:究竟什么是张量?
今天很多现有的深度学习系统都是基于张量代数(tensor algebra)而设计的,但是张量代数不仅仅只能用于深度学习.本文对张量进行了详细的解读,能帮你在对张量的理解上更进一步.本文作者为 MapR ...
- 干货丨深度学习和经典机器学习的全方位对比
本文将对比深度学习和经典机器学习,分别介绍这两种技术的优缺点以及它们在哪些问题 如何得到最佳使用. 深度学习已成为大多数AI问题的首选技术,使得经典机器学习相形见绌.但是,尽管深度学习有很好的性能,经 ...
- 干货丨深度学习VGG模型核心拆解
如今深度学习发展火热,但很多优秀的文章都是基于经典文章,经典文章中的一句一词都值得推敲和分析.此外,深度学习虽然一直被人诟病缺乏足够令人信服的理论,但不代表我们不能感性分析理解,下面我们将对2014年 ...
- “深度学习”这十年:52篇大神级论文再现AI荣与光
来源:新智元 本文约4100字,建议阅读6分钟 从"深度学习三巨头"到何恺明,从谷歌到MIT,52篇神级论文带大家回顾深度学习这十年. [ 导读 ]从自动驾驶到Deepfake,深 ...
- 深度学习及机器学习整理--多谢各个网络大神
1.Deep Learning(深度学习)学习笔记整理系列之(一) http://blog.csdn.net/zouxy09/article/details/8775360/ 2.Deep Learn ...
- 干货回顾丨深度学习性能提升的诀窍
Pedro Ribeiro Simoes拍摄 原文: How To Improve Deep Learning Performance 作者: Jason Brownlee 你是如何提升深度学习模型的 ...
- 干货回顾丨深度学习应用大盘点
当首次介绍深度学习时,我们认为它是一个要比机器学习更好的分类器.或者,我们亦理解成大脑神经计算. 第一种理解大大低估了深度学习构建应用的种类,而后者又高估了它的能力,因而忽略了那些不是一般人工智能 ...
最新文章
- numpy amin amax
- 机器学习笔记(二)模型评估与选择
- 【转】在无人值守程序(服务)中调用Microsoft Graph
- xml html 转化为字符串,XSLT:将字符串解析为XML节点集(concret:将HTML-String转换为节点集)?...
- 【高德地图API】从零开始学高德JS API(六)坐标转换
- 关于String,StringBuffer和StringBuilder之间的区别和联系
- 从IT应用架构角度,畅谈双活数据中心容灾解决方案
- 云管理平台为混合IT应用提供统一的方法
- Hegic Q1报告:TVL接近6000万美元,日交易量达2200万美元创新高
- 表格存储如何实现跨区域的容灾
- Liunx 内核漏洞
- SQLPrompt10带注册机(支持SSMS v18.5)
- There appears to be trouble with your network connection.Retrying
- 学it中的python怎么样_长安大专网教学历
- 多部分元件原理图封装的画法
- Ocata Neutron代码分析(六)——APIRouter的初始化(1)加载core plugin和service plugin...
- 编程小知识之时间显示
- 禁用Windows Defender Antivirus Service,让你文件正常运行
- 不要再叫自己“程序员”了
- rtcp 的jitter buffer
热门文章
- 【论文导读】- STFL: A Spatial-Temporal Federated Learning Framework for Graph Neural Networks
- 如何使用chatgpt写文章
- 「.集团、.我爱你、.biz」域名上线 |.LOVE域名只要25元|.ART上新白金域名
- 计算机视觉系列-业界动态-AI快车道-PaddleOCR最新进展
- 解决pydev与eclipse版本问题
- 测试工程师职业生涯规划
- PTA 查找(散列查找)
- 华硕vivobooks14重装系统注意事项
- vscode 配置代码片段
- 热点数据的发现、处理、更新