机器学习(课程笔记4)——逼近参数算法牛顿方法;
一.牛顿法(Newton's method)
上一节学习了一种二分类算法logistic regression,其中涉及到求likelihood function中的参数使$l(\theta)$maxmizing。当时用的是梯度上升(grdient ascent)方法。现在介绍一种对logistic regression收敛更快的算法。使用Newton's method 对假设函数是有要求的,假设函数要满足一系列的条件。
一.函数 f find $\theta\in\Re$ st. $f(\theta)=0$的$\theta$,
有$\theta^{(1)}=\theta^{(0)}-\Delta=\theta^{(0)}-\frac{f(\theta^{(0)})}{f'(\theta^{(0)})}$
推广为:$\theta^{(t+1)}=\theta^{(t)}-\frac{f(\theta^{(t)})}{f'(\theta^{(t)})}$
二.当 $l(\theta)$ want $\theta$ st. $l'(\theta)=0$
有$\theta^{(t+1)}=\theta^{(t)}-\frac{f'(\theta^{(t)})}{f''(\theta^{(t)})}$
三.$\theta$是向量时,推广为,
$\theta^{(t+1)}=\theta^{(t)}-H^{-1}\nabla_\theta{l(\theta)}$
,$\nabla_\theta{l(\theta)}$是l($\theta$)对$\theta_i$的导数,H为n*n的Hessian矩阵(二阶偏导),n为$\theta$的维数。当然牛顿法的计算代价因为求逆是比较大的,实际上在n不是太大时牛顿法仍是很快的。
二.指数族分布(exponential family distribution)
前面利用高斯分布(概率推导一节)导出了最小二乘,用伯努利分布导出了logistics regression。这两个分布都属于指数族分布,常见的如泊松分布,都是指数族分布。
- 在回归的例子中,经过假设随机噪声为高斯分布后,得到$y|x;\theta\sim\mathcal{N}(\mu,\sigma^2)$
$P(y^{(i)}|x^{(i)};\theta)=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(y^{(i)}-\theta^Tx^{(i)})^2}{2\sigma^2})$;在上一节的证明中$\sigma^2$是不影响$\theta$的最小值的。 - in classification example,二分类模型为$P(y|x;\theta)$~Bernoulli($\Phi$)
- $\mu,\Phi$是$\theta和x$的函数。
如果一种分布可以写成如下形式,就称它是指数族分布,
证明一:Bernoulli是指数族分布(近似定义$\Phi$是$\theta$的函数)
它和sigmoid函数相似
证明二:Gaussion是指数族分布(选择任意的$\sigma^2$不会改变$h_{\theta}(x)$)的值,即假设$\sigma^2=1,\mu是\theta的函数$
三.
广义线性模型(GLM-generalized linear models)
构造GLM
转载于:https://www.cnblogs.com/g6z3z/p/9268647.html
机器学习(课程笔记4)——逼近参数算法牛顿方法;相关推荐
- 吴恩达机器学习课程笔记一
吴恩达机器学习课程笔记 前言 监督学习---`Supervised learning` 无监督学习---`Unsupervised learning` 聚类 异常检测 降维 增强学习---`Reinf ...
- 李宏毅2020机器学习课程笔记(二)
相关专题: 李宏毅2020机器学习资料汇总 李宏毅2020机器学习课程笔记(一) 文章目录 4. CNN Convolutional Neural Network(P17) 5. GNN Graph ...
- 机器学习总结——机器学习课程笔记整理
机器学习笔记整理 说明 基础点整理 1. 基础数学知识 (1) 一些零七八碎的基础知识 (2) 最优化相关问题 (3) 概率论相关问题 (4) 矩阵相关问题 2. 回归(线性回归.Logistic回归 ...
- Github标星24300!吴恩达机器学习课程笔记.pdf
个人认为:吴恩达老师的机器学习课程,是初学者入门机器学习的最好的课程!我们整理了笔记(336页),复现的Python代码等资源,文末提供下载. 课程简介 课程地址:https://www.course ...
- 唐宇迪机器学习课程笔记:逻辑回归之信用卡检测任务
信用卡欺诈检测 基于信用卡交易记录数据建立分类模型来预测哪些交易记录是异常的哪些是正常的. 任务流程: 加载数据,观察问题 针对问题给出解决方案 数据集切分 评估方法对比 逻辑回归模型 建模结果分析 ...
- 干货|机器学习零基础?不要怕,吴恩达机器学习课程笔记2-多元线性回归
吴恩达Coursera机器学习课系列笔记 课程笔记|吴恩达Coursera机器学习 Week1 笔记-机器学习基础 1 Linear Regression with Multiple Variable ...
- 李弘毅机器学习课程笔记(一):机器/深度学习入门
文章目录 什么是ML ML分类 一个例子 Model(function) Loss function Error surface Optimization Conclusion 最近在Youtube上 ...
- 吴恩达机器学习课程笔记(1-10章)
第一章 1.1 什么是机器学习? 定义: 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准. 解释: 计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经 ...
- 永磁同步电机控制笔记:电机参数离线辨识方法
文章目录 概述 1.定子电阻离线辨识 1.1.定子电阻离线辨识原理 1.2.定子电阻离线辨识的误差来源及补偿方法 1.3.电阻离线辨识的具体方法 方法一 方法二 2.定子电感离线辨识 2.1.定子电感 ...
最新文章
- IPv6的一些特殊地址
- 基站定位LAC,CID转经纬度
- linux c 内存共享
- 1119:矩阵交换行
- P3723 [AH2017/HNOI2017]礼物(FFT)
- C/C++面试题—旋转数组的最小数字
- 全球破300万!小米11系列高端市场地位稳了
- c/c++_消除非标准警告
- 关于虚拟主机软件配置的问题
- [2018.10.11 T3] 欠钱
- 网页html5游戏修改器,正版H5游戏无限物品
- VS2017使用github
- stm32以中断方式扫描矩阵键盘
- webstorm控制台中文乱码解决
- idea 无法找到要转到的声明
- js 前端实现打印功能
- 如何用SaaS科技赋能中小企业管理
- APP用户界面设计六基本原则
- Redis高可用架构
- java合法标识符有哪些_Java中的合法标识符
热门文章
- 老男孩教育每日一题-124天:当我们使用ssh-keygen命令的时候,如何一键非交互生产密钥对呢?...
- 汲取Linux灵感 Pivotal开源大数据套件
- [Voice communications] 音量的控制
- 2012-11-25学习笔记
- 化解恶劣情绪山人自有妙计
- docker rabbitmq_RabbitMQ的介绍及使用进阶(Docker+.Net Core)
- java高级之注解详解
- kubernetes service 原理解析
- 西南交通大学计算机网络,西南交通大学计算机网络实验2015-2016第2学期期末试卷...
- 11Linux_vmtools