逻辑回归的损失函数:
J(θ)=-(ylogy^+(1-y)log(1-y^)) ,(这里省略了连加求和,事实上这是loss function)
当y=1时,J(θ)=-logy^,为了使得J(θ)更接近0,我们需要使得y^更接近于1,由于y^是在sigmoid函数作用之后得来的,它最大不会超过1,所以我们需要使y^尽可能的大。
同理,y=0时,J(θ)=-log(1-y^),所以为了使得J(θ)更接近0,我们需要使得y^更接近0,所以,我们需要让y^尽可能的小。

loss function损失函数是衡量单一训练样例的效果
cost function成本函数用于衡量参数w和b在全部训练集上的效果

那么如何使得成本函数变的更小呢,这里就需要提到梯度下降算法,由于我们的成本函数是一个凸函数(这也是我们为什么使用它而放弃使用1/2(y-y^)^2的原因),所以梯度下降算法会有很好的效果。

这里我们需要抛弃机器学习中J(θ)的设定,改为J(w,b),为什么这么做呢,我们可以更直观的理解“梯度下降算法”,梯度下降算法是如何使得J变小呢? 这里我们需要明白,w和b是如何变小的,当w和b变小J自然变小了,w:=w-αdJ/dw, b:=b-αdJ/db,这里我们就明白了,为什么J是变小的。(其实这里应该使用偏导符号 ∂,因为函数J有两个以上的变量,但是有点难打,所以理解就好)。

为何要向量化,向量化的好处是什么?
在python中,若不将w、x等向量化,那么需要进行大量循环操作,这无疑会减慢速度,例如对z=wx+b来说:
for i int range(n-x)
z+=wi*xi
z+=b
这样的代码是不好的代码 ,而作为对比
numpy .dot函数
z=np.dot(w,x)+b

对比

深度学习和神经网络——第二周笔记相关推荐

  1. 吴恩达深度学习 | (2) 神经网络与深度学习专项课程第二周学习笔记

    课程视频 第二周PPT汇总 吴恩达深度学习专项课程共分为五个部分,本篇博客将介绍第一部分神经网络和深度学习专项的第二周课程:神经网络基础.由于逻辑回归算法可以看作是一个单神经元(单层)的网络结构,为了 ...

  2. 网易云深度学习第一课第二周编程作业

    Part 2: Logistic Regression with a Neural Network mindset 你将学到: -建立学习算法的一般架构 -初始化参数 -计算损失函数和它的梯度 -使用 ...

  3. 吴恩达深度学习第一课--第二周神经网络基础作业下代码实现

    文章目录 需要的库文件 步骤 取出训练集.测试集 了解训练集.测试集 查看图片 数据维度处理 标准化数据 定义sigmoid函数 初始化参数 定义前向传播函数.代价函数及梯度下降 优化部分 预测部分 ...

  4. 吴恩达深度学习第一课--第二周神经网络基础作业上正反向传播推导

    文章目录 正向传播推导 第i个样本 向量化(从个别到整体) 判断向量维度 将原始数据进行整合 反向传播推导 第i个样本 损失函数 代价函数 梯度下降法(实则是多元函数求微分) 向量化(从个别到整体) ...

  5. 15个小时彻底搞懂NLP自然语言处理(2021最新版附赠课件笔记资料)【LP自然语言处理涉及到深度学习和神经网络的介绍、 Pytorch、 RNN自然语言处理】 笔记

    15个小时彻底搞懂NLP自然语言处理(2021最新版附赠课件笔记资料)[LP自然语言处理涉及到深度学习和神经网络的介绍. Pytorch. RNN自然语言处理] 笔记 教程与代码地址 P1 机器学习与 ...

  6. 吴教主深度学习和神经网络课程总纲

    第一部分:神经网络和深度学习 第一周 深度学习概论 第二周 神经网络基础 1.2.1 Logistic回归和梯度下降简介 1.2.2 Logistic回归和梯度下降计算的数学流程 练习:numpy b ...

  7. 一文掌握深度学习、神经网络和学习过程的历史

    来源:算法与数学之美 本质上,深度学习是一个新兴的时髦名称,衍生于一个已经存在了相当长一段时间的主题--神经网络. 从20世纪40年代开始,深度学习发展迅速,直到现在.该领域取得了巨大的成功,深度学习 ...

  8. 深度学习超分辨率综述阅读笔记(翻译)

    深度学习超分辨率综述阅读笔记(翻译) https://arxiv.org/abs/1902.06068 摘要:图像超分辨率(SR)是计算机视觉中增强图像和视频分辨率的一类重要图像处理技术.近几年来,图 ...

  9. 【深度学习】吴恩达深度学习-Course1神经网络与深度学习-第四周深度神经网络的关键概念编程(下)——深度神经网络用于图像分类:应用

    在阅读这篇文章之前,请您先阅读:[深度学习]吴恩达深度学习-Course1神经网络与深度学习-第四周深度神经网络的关键概念编程(上)--一步步建立深度神经网络,这篇文章是本篇文章的前篇,没有前篇的基础 ...

最新文章

  1. PL/SQL程序设计 第七章 包的创建和应用
  2. 面向对象的三个基本特征 和 五种设计原则
  3. 格兰因果模型可以分析哪些东西_如何系统地学习统计学,指导入门数据分析
  4. Oracle查询忽略大小写的实现方法
  5. 广播IP转型报告:远程制作持续崛起
  6. Android 系统(78)--应用安装时间长
  7. SQL SERVER 2016 AlwaysOn 无域集群+负载均衡搭建与简测
  8. Windows域控去掉密码强度策略 可以设置简单密码【全域策略生效】
  9. 品高打造西科大教育云,带你看懂高教云建设之路
  10. STM32官方应用笔记分类汇总
  11. 计算机公式sin,三角函数换算(新版中文三角函数计算器)
  12. Linux系统自动校准时间
  13. ios16更新了什么内容 ios16更新内容汇总
  14. 用styler更改样式后,解决数据框中数据无法保留四位小数
  15. 笔记本键盘输入错乱,字母都变成数字了
  16. 三星android 8.0 流畅,三星Galaxy S8使用安卓Android 8.0:更顺滑更流畅
  17. Spire.Doc利用word样式读取word文字内容(.NET)
  18. 计算机西方经济学试题,西方经济学的习题与答案
  19. YOLOV5训练过程中想减少或者增加epoch
  20. 计算机原理与应用作业,计算机原理与应用(杨刚)-中国大学mooc-题库零氪

热门文章

  1. java检查危险品程序_危险品检查java程序
  2. 阿里 开放平台 多伦对话_开放式领导者指南,以开始数字转换对话
  3. 高效pycharm使用技巧_您是否正在使用这种高效的采访技巧?
  4. android开源2016_开源的黄金时代,2016年的预测以及更多新闻
  5. (45)css面试题集锦二
  6. MyBatis 级联
  7. 2016年广东省电子设计大赛健康电子专题——健康养殖远程监控系统(环境监控系统V1.0版本)
  8. CAN笔记(23) CanFestival移植
  9. Java跨域请求cooking共享,关于HTML5中的sessionStorage和localStorage
  10. java子线程的创建_Java多线程基础(一):线程的创建