前言

学习算法一直以来是机器学习能根据数据学到知识的核心技术。而好的优化算法可以大大提高学习速度,加快算法的收敛速度和效果。本文从浅层模型到深度模型纵览监督学习中常用的优化算法,并指出了每一种优化算法的优点及局限性,同时其还包括了一阶和二阶等各种算法的形式化表达。

本文旨在介绍关于将最优化方法应用于机器学习的关键模型、算法、以及一些开放性问题。这篇博文适合有一定知识储备的读者,尤其是那些熟悉基础优化算法但是不了解机器学习的读者。首先,我们推导出一个监督学习问题的公式,并说明它是如何基于上下文和基本假设产生各种优化问题。然后,我们讨论这些优化问题的一些显著特征,重点讨论 logistic 回归和深层神经网络训练的案例。

本文的后半部分重点介绍几种优化算法,首先是凸 logistic 回归,然后讨论一阶方法,包括了随机梯度法(SGD)、方差缩减随机方法(variance reducing stochastic method)和二阶方法的使用。最后,我们将讨论如何将这些方法应用于深层神经网络的训练,并着重描述这些模型的复杂非凸结构所带来的困难。

1 引言

在过去二十年里,机器学习这一迷人的算法领域几乎以史无前例的速度崛起。机器学习以统计学和计算机科学为基础,以数学优化方法为核心。事实上,近来优化方法研究领域中的许多最新理论和实际进展都受到了机器学习和其它数据驱动的学科的影响。然而即使有这些联系,统计学、计算机科学和致力于机器学习相关问题的优化方法研究之间仍存在许多障碍。因此本文试图概述机器学习学习算法而打破这种障碍。

本文的目的是给出与机器学习领域相关的一些关键问题和研究问题的概述。考虑到涉及运筹学领域的知识,我们假设读者熟悉基本的优化方法理论,但是仍将引入

深度学习核心技术精讲100篇(二十八)-由浅入深概览机器学习优化算法相关推荐

  1. 深度学习核心技术精讲100篇(十八)-巨量数据下美团是如何实现数据治理的?

    背景 大数据时代的到来,让越来越多的企业看到了数据资产的价值.将数据视为企业的重要资产,已经成为业界的一种共识,企业也在快速探索应用场景和商业模式,并开始建设技术平台. 但这里要特别强调一下,如果在大 ...

  2. 深度学习核心技术精讲100篇(十九)--GBDT(梯度提升树) 和 Resnet (残差网络)的原理

    残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.在集成学习中可以通过基模型拟合残差,使得集成的模型变得更精确:在深度学习中也有人利用layer去拟合残差将深度神经网络的性能提高变强.这 ...

  3. 深度学习核心技术精讲100篇(十二)-DCGAN(对抗生成网络)算法应用及代码实现

    前言 一次偶然看到一个换脸的视频,觉得实在是很神奇,于是饶有兴致的去了解一下换脸算法.原来背后有一个极为有意思的算法思想--对抗生成. 随后各种各样的GAN算法以指数级增长的方式涌现出来,比如WGAN ...

  4. 深度学习核心技术精讲100篇(十四)-一文带你看懂GPflow的前世今生

    什么是GPflow GPflow是一个高斯过程的工具包,接口部分由python实现,内部的部分计算则由Tensorflow实现. 主要特点有二个:一是使用变分推理作为近似方法,二是使用自动微分进行求导 ...

  5. 深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能

    前言 之前的文章中谈到了机器学习项目中,要想使得使得机器学习模型进一步提升,我们必须使用到模型融合的技巧,今天我们就来谈谈模型融合中比较常见的一种方法--stacking.翻译成中文叫做模型堆叠,接下 ...

  6. 深度学习核心技术精讲100篇(十六)-搜索引擎Indri系列之如何建立索引 (Indexing)检索评价 (Evaluation)

    前言 在为文档集建立索引时,需要执行IndriBuildIndex path-to-to-index_parameter_file.这里的index_parameter_file是xml格式的参数文件 ...

  7. 深度学习核心技术精讲100篇(十五)-搜索引擎Indri系列之安装及使用

    前言 Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发. 安装 下 ...

  8. 深度学习核心技术精讲100篇(二十)-如何通过树模型实现梯度提升树(GBDT)+LR,随机森林(RandomForest) +LR

    前言 在讲如何通过树模型做特征工程之前,首先让我们回顾一下一个机器学习(除去深度学习项目部分)项目的大致流程: 从业务场景中抽象出问题--分类问题,回归问题,还是聚类问题等, 接下来是数据获取,数据清 ...

  9. 深度学习核心技术精讲100篇(二十四)-简单谈下深度学习在中文分词中的应用

    前言 随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼"手快有,手慢无".不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为 ...

最新文章

  1. 【財務会計】固定資産の除却と廃棄の違い
  2. LeetBook《程序员的算法趣题》Q18---水果酥饼日
  3. Unknown system variable 'query_cache_size'
  4. 牛客SQL22 统计各个部门的工资记录数
  5. zabbix--基础概念及原理
  6. vscode为各自项目添加launch和setting
  7. rabbitmq消息持久化,避免异常情况下,消息会丢失
  8. C++编程语言中异常处理(try-catch-throw)介绍
  9. java多态/重载方法——一个疑难代码引发的讨论
  10. SSP控制寄存器SSPCON
  11. 一二线城市知名 IT 互联网公司名单
  12. 残差网络—ResNet
  13. 使用mbedtls库实现ftps协议
  14. Android 获取屏幕高度、宽度
  15. SpringBoot 如何执行定时任务
  16. 【vue】基于element UI周控件实现的单选周和多选周
  17. UT2015学习笔记
  18. ble mac地址 协议_BLE(bluetooth low energy)协议栈介绍
  19. 做程序界中的死神,继续提升灵力上限
  20. 发育网络(DN): 一个涌现的图灵机

热门文章

  1. WordPress数据库及各表结构
  2. ANDROID 学习笔记(二) 用户登陆问题 TOKEN SESSION 缓存
  3. Linux 上的高可用中间件
  4. Spring3MVC+Mybatis3.1框架下的事务
  5. 对“纯手工编写的第一个Hibernate程序”的改进
  6. size-t数据类型 ssize-t数据类型
  7. c++STL之vector简易使用
  8. php获取http头信息,php如何获取http头信息
  9. 计算机 双 ip地址,win7双ip怎么设置_Win7电脑如何设置双IP地址
  10. nginx 集群部署_如何备份和还原您的Kubernetes集群资源和持久卷?