Ian Goodfellow曾经给在quora回答过,以下是原文:

There are various ways to test for convexity.

One is to just plot a cross-section of the function and look at it. If it has a non-convex shape, you don’t need to write a proof; you have disproven convexity by counter-example.

If you want to do this with algebra, one way is just to take the second derivatives of a function. If the second derivative of a function in 1-D space is ever negative, the function isn’t convex.

For neural nets, you have millions of parameters, so you need a test that works in high-dimensional space. In high-dimensional space, it turns out we can take the second derivative along one specific direction in space. For a unit vector d giving the direction and a Hessian matrix H of second derivatives, this is given by

For most neural nets and most loss functions, it’s very easy to find a point in parameter space and a direction where

is negative.

深度学习都是非凸问题_神经网络的损失函数为什么是非凸的?相关推荐

  1. 深度学习与计算机视觉系列(8)_神经网络训练与注意点

    深度学习与计算机视觉系列(8)_神经网络训练与注意点 作者:寒小阳  时间:2016年1月.  出处:http://blog.csdn.net/han_xiaoyang/article/details ...

  2. 都2021年了,不会还有人连深度学习都不了解吧(三)- 损失函数篇

    一.前言 深度学习系列文章陆陆续续已经发了两篇,分别是激活函数篇和卷积篇,纯干货分享,想要入门深度学习的童鞋不容错过噢!书接上文,该篇文章来给大家介绍" 选择对象的标准 "-- 损 ...

  3. 深度学习与计算机视觉系列(7)_神经网络数据预处理,正则化与损失函数

    作者:寒小阳 && 龙心尘  时间:2016年1月.  出处:  http://blog.csdn.net/han_xiaoyang/article/details/50451460  ...

  4. 深度学习--TensorFlow(4)BP神经网络(损失函数、梯度下降、常用激活函数、梯度消失梯度爆炸)

    目录 一.概念与定义 二.损失函数/代价函数(loss) 三.梯度下降法 二维w与loss: 三维w与loss: 四.常用激活函数 1.softmax激活函数 2.sigmoid激活函数 3.tanh ...

  5. 深度学习与计算机视觉系列(9)_串一串神经网络之动手实现小例子

    深度学习与计算机视觉系列(9)_串一串神经网络之动手实现小例子 作者:寒小阳  时间:2016年1月.  出处:http://blog.csdn.net/han_xiaoyang/article/de ...

  6. 深度学习与计算机视觉系列(10)_细说卷积神经网络

    转载自: 深度学习与计算机视觉系列(10)_细说卷积神经网络 - 龙心尘 - 博客频道 - CSDN.NET http://blog.csdn.net/longxinchen_ml/article/d ...

  7. 深度学习模型建立过程_所有深度学习都是统计模型的建立

    深度学习模型建立过程 Deep learning is often used to make predictions for data driven analysis. But what are th ...

  8. 深度学习与自然语言处理教程(3) - 神经网络与反向传播(NLP通关指南·完结)

    作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/36 本文地址:https://www.showmeai.tech/article-d ...

  9. 深度学习与计算机视觉系列(4)_最优化与随机梯度下降\数据预处理,正则化与损失函数

    1. 引言 上一节深度学习与计算机视觉系列(3)_线性SVM与SoftMax分类器中提到两个对图像识别至关重要的概念: 用于把原始像素信息映射到不同类别得分的得分函数/score function 用 ...

最新文章

  1. ArchLinux下LXDE的安装与设置心得
  2. scrapy提取数据
  3. Matlab mean() mean2() std() 函数的使用
  4. [云炬创业基础笔记] 第三章测试4
  5. 提高电脑反应速度_宁美千元价电脑,一体机设计+21英寸屏,办公娱乐选它
  6. linux如何生成so文件,新人问个问题,莫见笑:关于如何生成so文件,大家多多捧场啊...
  7. MySQL中int(5) 中的5代表什么意思?
  8. 通过对象属性去重_Redis常见对象类型的底层数据结构
  9. 漫画:什么是MD5算法
  10. 【音视频安卓开发 (一)】AndroidStudio项目配置权限、jni库路径、ABI、Cmake
  11. Ubuntu 13.04设置root用户登录图形界面
  12. php启动后no input file specified.,nginx+php出现No input file specified解决办法
  13. Linux/Unix系统下nginx+php安装简明教程
  14. 【渝粤教育】国家开放大学2018年秋季 2720T实用管理基础 参考试题
  15. 兄弟节点div, +~选择器不能向前选择
  16. 应云而生,原力觉醒——解读云原生基础设施 | 凌云时刻
  17. ldc1614 c语言编程,LDC1614读回来的数据为固定值不变
  18. 【高效学数据库】第一范式、第二范式、BCNF范式、第三范式、第四范式概念及举例
  19. matlabsvd提取特征值_MATLAB中的SVD函数
  20. java环境变量配置_Java环境变量配置终极版

热门文章

  1. ssh服务端口转发详解
  2. Python版——博客网站四 编写日志创建页
  3. 跳過 Windows RT的UI
  4. html5之web worker
  5. Entity Framework中使用IEnumerableT、IQueryableT及IListT的区别
  6. LESS CSS 框架简介(转)
  7. 超赞!12套你没见过的社交媒体 社交网站图标
  8. 一条命令解决系统N多故障
  9. 玩转带外触发的单目相机之一
  10. EtherCAT 网站链接