logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过logistic回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素。同时根据该权值可以根据危险因素预测一个人患癌症的可能性。

1、逻辑回归是用来做什么的呢?

回答:用来解决二分类问题

2、专业术语:

  • 样本:就是一行一行数据,采集数据

  • 特征:类似于mysql中的列

  • 标签列:又叫做结果列

3、回归和分类的区别?

通过输出结果可以判断出是连续问题,还是离散问题 。

  • 回归模型的输出是连续的

  • 分类模型输出的是离散的

4、案例(左分类,右回归)


5、逻辑回归公式

逻辑回归=线性回归+sigmoid函数br

其实就是我们数学中的一条直线,让现实数据,尽可能均匀落到该线的两侧,来实现正常分布


6、如何把回归编程分类?

在该图中,将x<=14划分为一类。x>14分为另为一类,实现二分类问题。


7、Sigmoid函数

上图为Sigmoid函数曲线图,x=0的位置可以将数据y=0.5,得到数据二分类。


8、Sigmoid函数作用


9、逻辑回归公式

10、判断算法好坏-损失函数

11、评价二分类模型

混淆矩阵、召回率、精确率、准确率

TP/TN/FP/FNT:TrueF :falseP:positiveN:Negativebr

11.1、准确率(accucry)

准确率(accucry)=总样本中预测对了多少?br

案例:

11.2、精确率(procision)

精确率(procision)=预测为正的样本中实际为正的有多少?br

案例:

11.3、召回率(Recall)

召回率(Recall)=实际为正的样本中有多少被预测为正了br

案例:

11.4、F1计算公式

F1就是为了让一个评价指标里,既能体现查准率,又能体现召回率而出现的公式br

逻辑回归算法_算法逻辑回归相关推荐

  1. 数据挖掘算法_算法篇(01) 数据挖掘算法初探

    前言 无论是传统行业,还是互联网行业.掌握数据,就是掌握规律.当你了解了市场数据,对它进行分析,就可以得到市场规律.当你掌握了产品自身的数据,对它进行分析,就可以了解产品的用户来源.用户画像等等.所以 ...

  2. 算法导论 算法_算法导论

    算法导论 算法 Algorithms are an integral part of the development world. Before starting coding of any soft ...

  3. python梯度提升回归树_梯度提升回归树(GBDT)

    梯度提升回归树(GBDT) 发布时间:2018-08-30 13:22, 浏览次数:1024 , 标签: GBDT 一.从Boosting思想开始 1.梯度提升回归树是一种从它的错误中进行学习的技术. ...

  4. python实现五大基本算法_算法基础:五大排序算法Python实战教程

    排序是每个算法工程师和开发者都需要一些知识的技能. 不仅要通过编码实现,还要对编程本身有一般性的了解. 不同的排序算法是算法设计如何在程序复杂性,速度和效率方面具有如此强大影响的完美展示. 让我们来看 ...

  5. Scikit-learn_回归算法_随机森林回归算法

    一.描述 随机森林回归模型能够通过组合不同的决策树降低方差,但有时会略微增加偏差.在实际应用中,方差降低通常比偏差增加更加显著,所以随机森林回归模型能够取得更好的效果. 二.用法和参数 n_estim ...

  6. 人群密度算法_算法人群的力量。

    人群密度算法 介绍 (Introduction) One of the most fascinating historical examples of the power of crowds can ...

  7. 蝴蝶优化算法_算法|FFT基础及各种常数优化,5万字笔记:公式推导+代码模板...

    作者:中二攻子 链接:https://ac.nowcoder.com/discuss/175409 来源:牛客网 本文含NTT.MTT.拆系数FFT.共轭优化FFT.多项式求逆与ln 约定: 1. 表 ...

  8. 有向图最长路径算法_算法数据结构 | 三个步骤完成强连通分量分解的Kosaraju算法...

    强连通分量分解的Kosaraju算法 今天是算法数据结构专题的第35篇文章,我们来聊聊图论当中的强连通分量分解的Tarjan算法. Kosaraju算法一看这个名字很奇怪就可以猜到它也是一个根据人名起 ...

  9. 广度优先算法_算法浅谈——走迷宫问题与广度优先搜索

    本文始发于个人公众号:TechFlow,原创不易,求个关注 在之前周末LeetCode专栏当中,我们详细描述了深度优先搜索和回溯法,所以今天我们继续这个话题,来和大家聊聊搜索算法的另一个分支,广度优先 ...

最新文章

  1. Java IO基础原理你该知道这些
  2. linux multipath简介配置 存储设备故障 负载均衡 虚拟化工具
  3. 12月第2周.NET总量TOP10:中土意涨幅均环比增大
  4. STL源码剖析 deque双端队列 概述
  5. python 代理类型说明
  6. STL标准模版库--vector的操作集合
  7. 极限学习机(Extreme Learning Machine,ELM)详解
  8. Qt学习—qt编写定时关机程序
  9. NetApp FAS 混合闪存阵列
  10. java实现给图片添加水印
  11. 2018-2019年度学习计划
  12. 腾讯云运维工程师认证TCA原题(2)
  13. 【轴承故障分解】基于 ITD实现轴承故障信号分解含Matlab源码
  14. 并行传输数据和串行传输数据_为什么串行数据传输比并行数据传输快?
  15. 如何轻松学习C语言编程!
  16. DDK开发介绍_自我学习
  17. Oracle数据库PL SQL开发、Oracle-SQL开发习题答案
  18. c语言位运算负数的实例_巧妙运用C语言位运算
  19. Spring Boot中html、js、Css、图片等应该放在什么位置
  20. 【微信小程序】别踩白块源码免费分享

热门文章

  1. springboot Autowired BeanNotOfRequiredTypeException
  2. 34988 Happy Reversal(二进制去取反)
  3. 云服务器重装系统后卡顿,云服务器Windows重装系统须知
  4. python arduino c_从Python向Arduino LCD发送一个字符串
  5. 听课评课记录计算机应用,教师听课的评语(精选10篇)
  6. mysql异步查询 java_基于 mysql 异步驱动的非阻塞 Mybatis
  7. linux对硬盘进行分区吗,Linux下如何对硬盘进行分区
  8. 俩台电脑怎么设置同一局域网_方法 | 把手机上的照片传到电脑上
  9. AttributeError: 'NoneType' object has no attribute 'astype'
  10. mysqldump备份(全量+增量)