点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达

来源丨机器学习初学者

转自丨极市平台

导读

一位CV领域的硕士问:一直弄不懂神经网络原理,看了很多教程博客还是弄不懂,我想是不是不需要弄懂啊?个人觉得:不懂原理能做些应用,但是想出成果就难了。可以参考下网友的讨论。

回答一

作者丨zyhu

有几种程度的“弄懂神经网络的原理”:

  1. 知道loss function的作用,知道sgd minimize loss function的过程就是神经网络(包括传统机器学习)的学习过程。知道loss function,optimizer背后的优化原理

  2. 知道CNN的一些trick,怎么调结构,调超参数,背后的直觉是什么,这个直觉就是原理

  3. 研究overparameterized neural network的generalization原理

这些原理的重要性:

  1. 这是大二数学,学习人工智能必备的。如果这都不懂,建议回炉重造

  2. 这是成为一名工程师必备的技能。这个搞不懂不建议从业人工智能

  3. 这是优秀PhD研究的内容。这个搞不懂对找工作毫无影响。

链接:https://www.zhihu.com/question/433274875/answer/1613600102

回答二

作者丨匿名用户

绝大部分所谓机器学习从业者,包括知乎上的,都对神经网络的原理一知半解。不指望所有从业者搞明白神经网络里面的数学,只希望能让大家不要觉得所谓的deep learning就是无脑调参。个人觉得即使不懂原理也可以找一个不错的工作,但在工作/科研中一定会受到局限。关于神经网络原理有很多工作,大范围的比如说Neural Tangent Kernel 的一系列工作。

https://arxiv.org/pdf/1806.07572.pdf

关心CNN的话对于residual connection也有很多理论解释https://arxiv.org/pdf/1909.04653.pdf

对于GAN,尤其是GAN的generalization bound也有不少人尝试

https://arxiv.org/pdf/1703.00573.pdf

以上都是冰山一角。还有很多关于神经网络的optimization的工作可以看Princeton的Jason Lee和UW的Simon Du 杜少雷。

回答三

作者丨霍华德

不懂原理,我觉得跑demo。做应用。写毕业论文甚至发论文可能都可以。但我觉得你找工作就比较困难了。

回答四

作者丨金海峰

以现在开源工具的发展水平来看,你即便是“只需要应用”也要搞懂一些原理,否则连应用都做不出来。你做应用至少还需要理解问题,根据问题选择合适的模型,并且调调超参数。针对特定问题,找到合适模型。这一步就需要你能看懂模型的适用范围与优缺点。想要做到这点,就需要你对其背后的原理有一定的了解。调超参数就更需要根据实验反馈结果定位哪个超参有问题了。这需要对模型和数据有更深刻的理解才行。所以,做应用就需要懂原理。但是,这是基于现有机器学习工具的发展水平来说的。也许有一天,会出现一个基于Keras的开源软件,自动帮你选模型调参呢。到时候你做应用可能就真的只会应用就行了,真的好期待这一天哦!

链接:https://www.zhihu.com/question/433274875/answer/1662351913

回答五

作者丨可乐

显然不是。即使只是应用神经网络的话,也需要理解常见的组件/模型结构的意义,它们为什么work/不work。例如batch normalization 的作用,skip-connection的作用,各种优化器的优缺点等知识点需要非常熟悉。不然你调参数的效率是会显著低于有经验的算法工程师的,而且当你遇到神经网络不收敛、loss降不下去、疯狂过拟合等各种各样的问题时你是没有办法知道怎么去解决的。上面举例的知识点掌握起来其实并不难,而且应用的话学到这种程度就足够了。至于背后深入的数学原理,神经网络可解释性的问题过于前沿了,现在不去了解也没有什么关系。

链接:https://www.zhihu.com/question/433274875/answer/1625527052

总结

绝大部分回答都是认为需要了解神经网络的原理,但是否深入,看你的需求了。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目31讲

在「小白学视觉」公众号后台回复:Python视觉实战项目31讲即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

下载4:leetcode算法开源书

在「小白学视觉」公众号后台回复:leetcode即可下载。每题都 runtime beats 100% 的开源好书,你值得拥有!


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

讨论:对于神经网络,不需要弄明白原理,只需要应用,是这样吗?相关推荐

  1. 对于神经网络,硕博士不需要弄明白原理,只需要应用,是这样吗?

    链接:https://www.zhihu.com/question/433274875 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 作者:匿名用户 https://www.zhihu.com ...

  2. PID算法终于弄明白原理了,原来就这么简单

    看起来PID高大尚,实则我们都是被他的外表所震撼住了.先被别人唬住,后被公式唬住,由于大多数人高数一点都不会或者遗忘,所以再一看公式,简直吓死.了解了很浅的原理后,结果公式看不懂,不懂含义,所以最终没 ...

  3. ThreadLocal原理详解--终于弄明白了ThreadLocal

    ThreadLocal原理详解 在我看到ThreadLocal这个关键字的时候我是懵逼的,我觉得我需要弄明白,于是,我就利用搜索引擎疯狂查找,试图找到相关的解答,但是结果不尽人意. 首先说一下我的理解 ...

  4. C语言字符加法原理,这个加法原理,在小学阶段一定要弄明白!

    原标题:这个加法原理,在小学阶段一定要弄明白! 要想学好小学数学,那么"加法原理"一定得弄明白了,今天就跟着极客数学帮曹天明老师来学习一下加法原理吧. 知识要点 一.加法原理概念引 ...

  5. 神经网络反向传播梯度计算数学原理

    [神经网络]反向传播梯度计算数学原理 1 文章概述 本文通过一段来自于Pytorch官方的warm-up的例子:使用numpy来实现一个简单的神经网络.使用基本的数学原理,对其计算过程进行理论推导,以 ...

  6. 你真的弄明白了吗?Java并发之AQS详解

    你真的弄明白了吗?Java并发之AQS详解 带着问题阅读 1.什么是AQS,它有什么作用,核心思想是什么 2.AQS中的独占锁和共享锁原理是什么,AQS提供的锁机制是公平锁还是非公平锁 3.AQS在J ...

  7. 3分钟弄明白JAVA三大修饰符

    3分钟弄明白JAVA三大修饰符 JAVA的三个修饰:static,final,abstract,在JAVA语言里无处不在,但是它们都能修饰什么组件,修饰组件的含义又有什么限制,总是混淆.所以来总结对比 ...

  8. 弄明白HASH,你就弄明白区块链的一大半

    "人类历史上第一次,全世界各地的人,花费巨额的成本,争前恐后地寻找美学意义上的数学运算结果." -卫sir Beeple加密艺术作品<区块链> 说起区块链,似乎大家都懂 ...

  9. 想做程序员?弄明白这些问题,你会少走很多弯路

    前言 几乎每一个新手程序员都会走上那么一段自学的道路,尤其是在校生或进入工作岗位之后,技术的提升基本都靠自学,有的虽然是网上报班学习,但更多时候还是自己在学习,师傅引进门,修行靠个人. 有的人自学很快 ...

最新文章

  1. mysql 2006测试_狂神说MySQL06:事务和索引
  2. koreader下载_koreader下载_koreader安装_koreader最新版_koreader安卓版下载_koreader app_易玩网...
  3. golang 大数据平台_大数据平台是什么?有哪些功能?如何搭建大数据平台?
  4. input属性disabled和readonly的区别
  5. JNCIS翻译文档之------接口3
  6. linux tcp重传超时时间,tcp 重传超时次数
  7. Promise 必知必会(十道题)
  8. LeetCode之 x 的平方根
  9. visio程序流程图绘制教程
  10. 单片机4*4矩阵键盘的原理
  11. C++编写的一个图书管理系统
  12. unite17-shanghai-JPLee-netease-pangu-FullChinese
  13. mysql lag over_lag函数(lag函数用法)
  14. 解决方案 word excel vba 以下隐藏模块存在编译错误
  15. 廖雪峰Python教程 实战day05
  16. Word中插入Visio留空太大怎么办
  17. 什么是HRMS?哪些工作需要使用HRMS?
  18. 《COOL3D 中文金典版 COOL3D STUDIO (原亮剑版更新)》(COOL 3D Production Studio
  19. iwebshop与MySQL无法并存吗_该如何做好iwebshop网上购物商场
  20. 《Oracle内核技术解密》读书笔记(三)

热门文章

  1. 京东金融科技学堂开班,AI 在金融云上有了新成果
  2. 基于Java的疫情防控管理系统
  3. 说实话,DataGrip真得牛逼,只是你不会用而已~
  4. Mysql4种方式避免重复插入数据!
  5. 技术总监的反思录:我是如何失去团队掌控的?
  6. 据说中台凉了?唔,真香
  7. 创建节约内存的JavaBean
  8. @即将读研的师弟师妹们!
  9. 更新!带你认识推荐系统全貌的论文清单
  10. 脱口秀演员入职华为?破案了:人家还是博士后研究员