目录

1.线性回归损失函数的极大似然推导:西瓜书公式3.4除了用最小二乘法以外,怎么用极大似然推得?

2:一元线性回归的参数求解公式推导:西瓜书公式3.7和3.8怎么推来的?

公式3.7,3.8推导:(一不小心就出错了,哈哈)

3:多元线性回归的参数求解公式推导:西瓜书公式3.10和3.11怎么推来的?

则3.10推导:

3.11推导:

4:线性回归损失函数的最优化算法:

(1)批量梯度下降(Batch Gradient Descent)

(2)随机梯度下降(Stochastic Gradient Descent)

(3)小批量梯度下降(Mini Batch Gradient Descent)


线性回归是一种回归分析技术,回归分析本质上就是一个函数估计的问题(函数估计包括参数估计和非参数估计),就是找出因变量和自变量之间的因果关系。回归分析的因变量是应该是连续变量,若因变量为离散变量,则问题转化为分类问题,回归分析是一个有监督学习问题。

线性其实就是一系列一次特征的线性组合,在二维空间中是一条直线,在三维空间中是一个平面,然后推广到n维空间,可以理解维广义线性吧。


1.线性回归损失函数的极大似然推导:西瓜书公式3.4除了用最小二乘法以外,怎么用极大似然推得?

线性回归(linear regression):

试图学得一个线性模型以尽可能准确的预测实值。

极大似然估计:

估计类条件概率的一种常用策略是先假定其具有某种确定的概率分布形式,再基于训练样本对概率分布的参数进行估计。

推导:

为了使得似然函数lnL(θ)最大,即要最后一行括号内最小,前两项为定值,也就是第三项最小化。也就是误差平法和最小。


2:一元线性回归的参数求解公式推导:西瓜书公式3.7和3.8怎么推来的?

公式3.7,3.8推导:(一不小心就出错了,哈哈)


3:多元线性回归的参数求解公式推导:西瓜书公式3.10和3.11怎么推来的?

先认识下矩阵转置的运算和转置矩阵的偏导数运算规则:

则3.10推导:

3.11推导:


4:线性回归损失函数的最优化算法:

首先,说下梯度下降的原理:

导数的数学定义:

由公式可见,对点x0的导数反映了函数在点x0处的瞬时变化速率,或者叫在点x0处的斜度,也就是x0处切线的斜率。推广到多维函数中,就有了梯度的概念,梯度是一个向量组合,反映了多维图形中变化速率最快的方向。

借用吴恩达在课程中讲解到的梯度下降法更新参数的部分:

(1)批量梯度下降(Batch Gradient Descent)

批量梯度下降法是梯度下降法最原始的形式,它的具体思路是在更新每一参数时都使用所有的样本来进行更新

优点:易于并行运算;

缺点:算法会非常耗时,因为每调整一次模型参数需要都要遍历所有样本;假设max_step固定,耗时将成倍增加。

(2)随机梯度下降(Stochastic Gradient Descent)

意如其名,在每次迭代时,随机的选取一个样本进行运算,反向更新模型参数。

优点:计算一个样本就优化一次参数,训练速度很快;

缺点:由于样本随机性太强,易于陷入局部最优而无法自拔,不易于并行实现。

(3)小批量梯度下降(Mini Batch Gradient Descent)

批量梯度下降计算了所有的样本才更新模型一次;随机梯度下降计算一个样本就更新模型一次,这两种明明就是两个极端啊。

思考:有没有介于两者之间的,别那么傻的,稍微聪明一点的。那就是小批量梯度下降(Mini Batch Gradient Descent)。批量梯度下降是把整个样本集当作一个批量,小批量就是把整个样本集进行拆分了,batch=64,或者32,这样一个小批量集计算一次,然后更新一次参数。

优点:

  • 易于并行实现;
  • 通过矩阵运算,每次在一个batch上优化神经网络参数并不会比单个数据慢太多。

缺点:样本集大小选取不当可能会带来某些问题。

ok.欢迎评论批评指正。

DataWhale基础算法第一次作业---线性回归相关推荐

  1. 2015计算机应用基础平时作业答案,2015秋《计算机应用基础》第一次作业

    2015秋<计算机应用基础>第一次作业 一.单项选择题.本大题共50个小题,每小题 2.0 分,共100.0分.在每小题给出的选项中,只有一项是符合题目要求的. 1. 第一台电子计算机是1 ...

  2. 16秋川大计算机基础作业,川大 16秋 《计算机应用基础》第一次作业答案

    <川大 16秋 <计算机应用基础>第一次作业答案>由会员分享,可在线阅读,更多相关<川大 16秋 <计算机应用基础>第一次作业答案(7页珍藏版)>请在人 ...

  3. 国科大学习资料--人工智能原理与算法-第一次作业解析(学长整理)

    国科大学习资料–人工智能原理与算法-第一次作业解析(张文生老师主讲)(1.3.1.7.1.9.1.14.1.15) 1.3 反射行动(比如从热炉子上缩回你的手)是理性的吗?它们是智能的吗? 答:反射行 ...

  4. 四川大学网络教育计算机应用基础,四川大学网络教育学院《计算机应用基础》第一次作业...

    - 09秋学期<计算机应用基础>第一次作业 欢迎你 本次作业总分数:100.0分 本次作业你最多可以做三次,作业的最后分数以三次中最高那次为准.目前是你第1次做本作业. 一.单项选择题.本 ...

  5. 计算机应用基础实训任务12345答案,《计算机应用基础》第一次作业题目、答案.doc...

    <计算机应用基础>第一次作业题目.答案.doc (3页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 9.90 积分 福建师范大学网络教育学院 ...

  6. 中国石油大学(北京)《机械制造基础》第一次作业

    第一次在线作业 单选题 (共30道题) 收起 1.(2.5分) ( )时,前角应选大些. A.加工脆性材料 B.工件材料硬度高: C.加工塑性材料 D.脆性或塑性材料 我的答案:C  此题得分:2.5 ...

  7. 交大计算机基础知识第一次作业,上海交大计算机第一次作业

    利用计算机进行数据处理的应用领域主要有事务处理.企业管理.______. 选择一项: a. 人工只能和办公自动化 b. 办公自动化.信息资料检索 c. 信息资料检索和科学计算 d. 事务处理和自动控制 ...

  8. 数字计算机第一次应用于工业是什么时候,计算机应用基础(二)第一次作业(95%的答案)(1884页)-原创力文档...

    1 自计算机 问世至今已经经历了四个时代,划分时 代的主要依据是计算机的______ . 答案: D A 规模 B 功能 C 性能 D 构成元件 2 一般认为,世界上第一台电子数字计算机诞生于 ___ ...

  9. 算法第一次作业(2.帐篷问题)

    题目: 某公司团建郊游,男女生一共有T个人,其中X个为男生, Y个为女生,再其中,有v对异性情侣,到宿营地后,开始分配帐篷. 帐蓬有三种,三人帐篷,普通双人帐篷和爱心帐篷. 注意,普通帐篷双人和三人帐 ...

最新文章

  1. 公告:Rover's Official Blog停止更新
  2. Linux下的SVN命令
  3. ThreadLocal的学习
  4. GBin1专题之Web热点秀#15
  5. 【组图】地震前线归来--心中的震撼
  6. python之路 -- 并发编程之进程
  7. Laravel 在哪些地方使用了 trait ?
  8. 使用DevCpp/DevC++调试的设置和步骤
  9. [RTOS]uCOS、FreeRTOS、RTThread、RTX等RTOS的对比之特点
  10. 易软门诊管理软件php,易软诊所管理软件
  11. windows——DOS命令集锦
  12. AI中台——智能聊天机器人平台的架构与应用
  13. 时钟周期、机器周期、指令周期的概念及三者之间的关系;定时器及计数器
  14. 为什么选择WordPress作为企业CMS?
  15. 苹果电脑拷贝文件到u盘很慢_给自己挑个好U盘,再也不想天天找同事借了
  16. 【历史上的今天】11 月 26 日:中国移动的第1亿个用户;Microsoft 确立名字;控制论鼻祖出生
  17. 计算机一级程测试题,2017计算机全国一级考试选择题整理.doc
  18. 数字IC手撕代码-兆易创新笔试真题
  19. CSS中如何实现背景图片透明并且固定和文字不透明效果
  20. (转)使用jsonp帮助你知道关注的他或她QQ音乐中搜藏了什么歌曲

热门文章

  1. java自带的四种线程池
  2. Android实现应用程序的开机自启动
  3. (H5+安卓+ios)直播app系统源码,直播商城带货源码,方维直播app系统,直播短视频源码
  4. HWC blending mode
  5. 厘清大数据要点,技术成长不迷茫
  6. mysql租房信息查询_使用mysql对上海租房信息进行简单数据分析
  7. 淄博职业学院计算机应用技术专业,淄博职业学院计算机应用技术专业2016年在山东理科高考录取最低分数线...
  8. 教程篇(5.0) 05. 通信控制 ❀ FortiEDR ❀ Fortinet 网络安全专家 NSE 5
  9. 新手小白该如何真正起步做跨境电商独立站?
  10. 国家会议中心:参加百度【框广天下,搜赢未来】推广会议