神经网络和深度学习
上一篇 主目录 下一篇

文章结构

  • 1.逻辑回归

前言
逻辑回归学习算法,该算法适用于二分类问题,本节将主要 介绍逻辑回归的 Hypothesis Function(假设函数)
本文中符号约定见:神经网络和深度学习(4)–符号约定


1.逻辑回归

对于二元分类问题来讲,给定一个输入特征向量X ܺ,它可能对应一张图片,你想识别这 张图片识别看它是否是一只猫或者不是一只猫的图片,你想要一个算法能够输出预测,你只 能称之为yhat,也就是你对实际值 y的估计。更正式地来说,你想让 yhat 表示 y 等于 1 的一 种可能性或者是机会,前提条件是给定了输入特征 ܺ,你想让 yhat 来告诉你这是一只猫的图片的机率有多大。X 是一个݊ nx X 1维的向量(相当于有݊nx 个特征的特征向量)。我们用 w 来表示逻辑回归的 参数,这也是一个݊ nx 维向量,参数里 面还有b ܾ,这是一个实数(表示偏差)。所以给出输入x以及参数 w 和 ܾ b之后,我们怎样 产生输出预测值ݕ̰,一件你可以尝试却不可行的事是让yhat=wTx+b ܾ。

这时候我们得到的是一个关于输入 x的线性函数,实际上这是你在做线性回归时所用到 的,但是这对于二元分类问题来讲不是一个非常好的算法,因为你想让yhat表示实际值 y等于 1 的机率的话,yhat应该在 0 到 1 之间。这是一个需要解决的问题,因为wTx+b可能比 1 要 大得多,或者甚至为一个负值。对于你想要的在 0 和 1 之间的概率来说它是没有意义的,因 此在逻辑回归中,我们的输出应该是yhat等于由上面得到的线性函数式子作为自变量的 sigmoid 函数中,公式如上图最下面所示,将线性函数转换为非线性函数。

些要注意的事情,如果 非常大那么t 将会接近于 0,关于 的 sigmoid 函数将会近似等于1 除以 1 加上某个非常接近于 0 的项,因为 t 的指数如果是个绝对值很大的负数的话,这项将会接近于 0,所以如果 很大的话那么关于 的 sigmoid 函数会非常接近 1。相反地,如果 非常小或者说是一个绝对值很大的负数,那么关于t 这项会变成一个很大的数,你可以认为这是 1 除以 1 加上一个非常非常大的数,所以这个就接近于 0。实际上你看到当 变成一个绝对值很大的负数,关于 的 sigmoid 函数就会非常接近于 0,因此当你实现逻辑回归时,你的工作就是去让机器学习参数 以及 这样才使得 成为对 这一情况的概率的一个很好的估计。


神经网络和深度学习系列笔记: 传送门

神经网络和深度学习(5)-- 逻辑回归相关推荐

  1. 深度学习原理-----逻辑回归算法

    系列文章目录 深度学习原理-----线性回归+梯度下降法 深度学习原理-----逻辑回归算法 深度学习原理-----全连接神经网络 深度学习原理-----卷积神经网络 深度学习原理-----循环神经网 ...

  2. 【深度学习】逻辑回归及其损失函数的理解

    文章目录 一.什么是二分类与逻辑回归(Logistic Regression)? 二.逻辑回归基本思路 三.定义损失函数(Loss Function) 一.什么是二分类与逻辑回归(Logistic R ...

  3. 吴恩达《神经网络和深度学习》第二周编程作业—用神经网络思想实现逻辑回归

    吴恩达<神经网络和深度学习>-用神经网络思想实现逻辑回归 1 安装包 2 问题概述 3 学习算法的一般架构 4 构建算法的各个部分 4.1 激活函数 4.2 初始化参数 4.3 前向和后向 ...

  4. 深度学习基础--SOFTMAX回归(单层神经网络)

    深度学习基础–SOFTMAX回归(单层神经网络) 最近在阅读一本书籍–Dive-into-DL-Pytorch(动手学深度学习),链接:https://github.com/newmonkey/Div ...

  5. 干货 | 神经网络与深度学习精选文章汇总

    AI有道 不可错过的AI技术公众号 关注 下面这部分列出了吴恩达深度学习专项课程中关于NN和DNN方面的所有精炼笔记.主要包括:神经网络与深度学习.优化神经网络.构建机器学习项目三块内容. 如果你对我 ...

  6. 吴恩达《神经网络与深度学习》精炼笔记(5)-- 深层神经网络

    上节课我们主要介绍了浅层神经网络.首先介绍神经网络的基本结构,包括输入层,隐藏层和输出层.然后以简单的2 layer NN为例,详细推导了其正向传播过程和反向传播过程,使用梯度下降的方法优化神经网络参 ...

  7. 吴恩达《神经网络与深度学习》精炼笔记(4)-- 浅层神经网络

    上节课我们主要介绍了向量化.矩阵计算的方法和python编程的相关技巧.并以逻辑回归为例,将其算法流程包括梯度下降转换为向量化的形式,从而大大提高了程序运算速度.本节课我们将从浅层神经网络入手,开始真 ...

  8. Coursera吴恩达《神经网络与深度学习》课程笔记(5)-- 深层神经网络

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了浅层神经网络.首先介绍神经网络的基本结构,包括输入层,隐藏层和输出层.然后以简单的2 layer NN为例,详细推导了其正向传 ...

  9. Coursera吴恩达《神经网络与深度学习》课程笔记(3)-- 神经网络基础之Python与向量化

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了逻辑回归,以输出概率的形式来处理二分类问题.我们介绍了逻辑回归的Cost function表达式,并使用梯度下降算法来计算最小 ...

最新文章

  1. java run_javarun
  2. Educational Codeforces Round 12 C. Simple Strings 贪心
  3. 在Linux Debian 8下部署基于PHP的Web项目。
  4. .NET平台常用的开发组件
  5. 2021-03-20 包含生成树的性质
  6. 会java学scala多久_Scala中超时的未来
  7. PHP封装curd,CURD · TookPHP开发手册 · 看云
  8. 牛客练习赛51-记录
  9. 服务器被一堆系统登录_WIN10做天高服务器客户端登录出现“操作系统原因无法登录”...
  10. java怎么输出点,Java实现控制台输出两点间距离
  11. java程序输出88的0 1矩阵_《剑指Offer》Java实现--顺时针打印矩阵
  12. TimeSpan 用法 求离最近发表时间的函数
  13. 多区域OSPF的路由重发布
  14. (2)MyBatis简介
  15. python函数和模块有什么关键特性_【Python函数与模块】(2)函数的特点
  16. Maven 项目管理 —— 安装与配置
  17. 简明python教程-简明Python教程-中文版.pdf
  18. 在CentOS中安装MySql数据库教程
  19. 拼音分词器_自动补全
  20. 代理服务器与反向代理服务器

热门文章

  1. svchost.exe是什么进程,svchost.exe是病毒吗?
  2. ArduinoUNO+ESP8266实现MQTT简单发布(不烧录ESP8266)
  3. 第二十二章 核心与核心模块
  4. copy和xcopy有何区别
  5. pdf转成cad,教你pdf转cad的方法
  6. 匪警请拨110,即使手机欠费也可拨通! 为了保障社会秩序,保护人民群众生命财产安全,警察叔叔需要与罪犯斗智斗勇,因而需要经常性地进行体力训练和智力训练!某批警察叔叔正在进行智力训练:1 2 3 4
  7. v4l2驱动编写篇【转】
  8. Java工作五个月了_总结到ict5个月以来的工作
  9. 已知收到的汉明码(按配偶原则配置)为1100111、1100001,检查上述代码是否出错?
  10. vuex与计算属性详解