卖萌屋的妹子们(划掉)作者团整理的算法工程师思维导图,求职/自我提升/查漏补缺神器。该手册一共分为数据结构与算法、数学基础、统计机器学习和深度学习四个部分。

下面是第二部分统计机器学习的内容~

公众号后台回复思维导图获取完整手册(Xmind脑图源文件,学习起来更方便(ง •_•)ง

统计机器学习

线性回归

  • 回归方程:Y = WX

  • 解析解:

  • 损失函数-最小二乘法

    用高斯概率密度函数表示出y,然后进行极大似然估计

    • 理解:频率派角度-误差复合高斯分布的最大似然估计

    • 求法:误差服从正太分布(0,sigma) => y服从正太分布(wx,sigma)

  • 正则化

    从两个角度理解:

    • 频率角度:维度太大无法求逆矩阵,且容易过拟合,给w加上约束 是半正定,不一定可逆, 为半正定加单位矩阵,是正定的,可逆

    • 贝叶斯角度(最大后验):参数符合laplace分布>L1正则,符合高斯分布>L2岭回归

线性分类

线性分类器是通过特征的线性组合来做出分类决定的分类器。数学上来说,线性分类器能找到权值向量w,使得判别公式可以写成特征值的线性加权组合。

  • 硬分类

    • 感知机

      二分类模型,y为{-1, 1} 损失函数:误分类点到分类平面到距离,分对为0,分错>0;

    • Fisher判别分析

      把样本点投影到一个平面,类间均值差大,使得类内方差小

  • 软分类

    P(Y|X) = P(X|Y)P(Y) / P(X)

    判别模型直接求P(Y|X) 生成模型求P(X,Y)=>P(X|Y)P(Y)=>P(Y|X)

    • 判别式: 逻辑回归

      由对数几率=>sigmoid:
      https://zhuanlan.zhihu.com/p/42656051

      公式推导:
      https://zhuanlan.zhihu.com/p/44591359

      简介:逻辑回归是使用sigmoid作为链接函数的广义线性模型,应用于二分类任务。它假设数据服从伯努利分布,对条件概率进行建模,通过极大似然估计的方法,运用梯度下降求解参数。

      目标函数

      求解:迭代法(为什么不求解析解?换成矩阵形式后,X和exp(X)同时存在,无法求出解析解。)逻辑回归的损失函数L是一个连续的凸函数,它只会有一个全局最优的点,不存在局部最优。可以用SGD。

      Bias的可解释性:对于偏差b (Bias),一定程度代表了正负两个类别的判定的容易程度。假如b是0,那么正负类别是均匀的。如果b大于0,说明它更容易被分为正类,反之亦然。

      线性决策边界

      为什么不能用线性回归做分类?

      https://www.zhihu.com/question/319865092/answer/661614886

      平方差的意义和交叉熵的意义不一样。概率理解上,平方损失函数意味着模型的输出是以预测值为均值的高斯分布,损失函数是在这个预测分布下真实值的似然度,softmax损失意味着真实标签的似然度。

    • 由来及其表达式:用线性回归拟合 ,得到对数几率回归

    • 生成式:朴素贝叶斯

      朴素贝叶斯是基于贝叶斯定理与特征条件独立假设大分类方法,对于给定的x,对x,y的联合分布建模(P(x|y)&P(y)),输出后验概率最大的Y,对P(x|y)采用了极大似然估计

      当特征离散时为线性分类:离散特征的朴素贝叶斯分类器判别公式能够写成特征值的加权线性组合。
      https://www.jianshu.com/p/469accb2e1a0

      假设:特征间相互独立,P(x1|y)与P(x2|y)相互独立 P(x1, x2, .., xn | Y) = P(x1|Y) * P(x2|Y) * ... * P(xn|Y)

      求解:对于给定的x,对x,y的联合分布建模(P(x|y)&P(y)),输出后验概率最大的Y,对P(x|y)采用了极大似然估计

      max[P(x|y)P(y)],y服从伯努利分布,x|y服从categorial分布或高斯分布

      一般假设朴素贝叶斯的特征为离散值

    • 生成式:高斯判别分析

      假定已知类中的x的分别服从高斯分布,对于二分类,p(x|y=0)和p(x|y=1)分别服从两个高斯分布,方差一样,y服从bernoulli(p),

      方差相同的情况下为线性分类(可以写成特征值x的线性加权组合):
      https://www.jianshu.com/p/469accb2e1a0

      方差相同时把消掉了,否则带有就不是线性了

SVM

https://zhuanlan.zhihu.com/p/61123737

解读:https://zhuanlan.zhihu.com/p/49331510

考点:https://zhuanlan.zhihu.com/p/76946313

  • 分类

    • 线性可分SVM

      当训练数据线性可分时,通过硬间隔(hard margin,什么是硬、软间隔下面会讲)最大化可以学习得到一个线性分类器,即硬间隔SVM

    • 线性SVM

      当训练数据不能线性可分但是可以近似线性可分时,通过软间隔(soft margin)最大化也可以学习到一个线性分类器,即软间隔SVM

    • 非线性SVM

      当训练数据线性不可分时,通过使用核技巧(kernel trick)和软间隔最大化,可以学习到一个非线性SVM

  • 线性可分SVM凸二次规划形式的推导

  • 拉格朗日乘子法和KKT条件

  • 凸二次规划求解

  • 软间隔最大化

  • 序列最小优化算法(SMO)

  • 核函数

  • 常见问题

    • 与感知机的区别

    • 与逻辑回归的对比

    • SVM优缺点

    • 二分类到多分类

树模型

  • 常见算法

    • XGBOOST

      优点:不用做特征标准化,可以处理缺失数据,对outlier不敏感

      理解泰勒展开
      https://www.zhihu.com/question/25627482/answer/31229830

      理解GBDT
      https://www.zybuluo.com/yxd/note/611571

      官方文档
      https://github.com/dmlc/xgboost/tree/master/demo http://xgboost.readthedocs.io/en/latest/parameter.html#general-parametershttp://xgboost.readthedocs.io/en/latest/python/python_api.html

      调参
      https://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-codes-python/ https://www.dataiku.com/learn/guide/code/python/advanced-xgboost-tuning.html

      源码剖析
      https://wenku.baidu.com/view/44778c9c312b3169a551a460.html min_child_weight: https://www.zhihu.com/question/68621766

      scale_pos_weight: https://blog.csdn.net/h4565445654/article/details/72257538

      节点分裂:H,Weighted Quantile Sketch, h对loss有加权的作用

      稀疏值处理:行抽样、列抽样

      Shrinkage:学习速率减小,迭代次数增多,有正则化作用

      系统设计:Columns Block, Cache Aware Access Gradient-based One Side Sampling (GOSS) Exclusive Feature Bundling (EFB)

    • LightGBM

      官方文档
      http://lightgbm.readthedocs.io/en/latest/ https://github.com/Microsoft/LightGBM

      改进:直方图算法;直方图差加速;Leaf-wise建树;特征并行和数据并行的优化

    • Random Forest

      调参
      http://www.cnblogs.com/pinard/p/6160412.html

      https://www.zhihu.com/question/34470160/answer/114305935

      https://zhuanlan.zhihu.com/p/25308120

      原理
      http://www.cnblogs.com/pinard/p/6156009.html https://www.jianshu.com/p/dbf21ed8be88

      优化
      https://stackoverflow.com/questions/23075506/how-to-improve-randomforest-performance

  • 信息熵相关概念

  • 生成

    • ID3:信息增益

    • C4.5:信息增益比

    • CART:回归-平方误差/分类-基尼指数

  • 剪枝

    • 叶节点个数

    • 预剪枝/后剪枝

图模型

  • 有向图

    https://www.zhihu.com/question/53458773/answer/554436625

    贝叶斯网络(Bayesian Networks, BNs)是有向图, 每个节点的条件概率分布表示为P(当前节点|父节点)

    从朴素贝叶斯到HMM:在输出序列的y时,依据朴素贝叶斯只有 。没有考虑yi之间的关系,因此加入,得到HMM

    • HMM

      定义:HMM是关于时序的概率模型,由一个隐藏的马尔可夫链生成不可观测的状态随机序列,再由各个状态生成观测序列

      三要素:初始状态概率向量,状态转移矩阵A,观测/发射概率矩阵B

      假设:齐次马尔可夫&观测独立

      概率计算:给定三要素和观测序列,生成观测序列概率

      学习问题:给定观测序列,用极大似然估计三要素

      预测/解码:给定观测序列和三要素,求最可能的状态序列

    • 朴素贝叶斯

      https://www.zhihu.com/question/53458773/answer/554436625

  • 无向图

    https://www.zhihu.com/question/53458773/answer/554436625

    马尔可夫网络则是无向图, 包含了一组具有马尔可夫性质的随机变量. 马尔可夫随机场(Markov Random Fields, MRF)是由参数(S,π,A)表示, 其中S是状态的集合,π是初始状态的概率, A是状态间的转移概率。一阶马尔可夫链就是假设t时刻的状态只依赖于前一时刻的状态,与其他时刻的状态和观测无关。这个性质可以用于简化概率链的计算。

    • 逻辑回归

      https://www.zhihu.com/question/265995680/answer/303148257

      朴素贝叶斯与逻辑回归的关系:都是对几率P/(1-P)进行拟合。朴素贝叶斯基于条件独立假设,另特征间相互独立,通过P(X|Y)P(Y)=>联合概率分布求得几率

      逻辑回归拟合特征间的关系:用线性回归逼近几率

    • CRF

      模型定义

      举例:
      https://zhuanlan.zhihu.com/p/104562658

      无向图:在给一个节点打标签时,把相邻节点的信息考虑进来(马尔可夫性:只与相邻的两个状态有关)

      线性链条件随机场:P(Yi|X,Y1,...Yn) = P(Yi|X, Yi-1, Yi+1),只考虑当前和前一个 由输入序列预测输出序列的判别模型,对条件概率建模

      观测序列,状态/标记序列

      特征函数:转移特征t(依赖当前和前一个位置),状态特征s(依赖当前位置),t和s对取值为1或0

      特征函数

      转移特征t(依赖当前和前一个位置),状态特征s(依赖当前位置),t和s对取值为1或0

      与逻辑回归比较:CRF是逻辑回归的序列化版本

      与HMM比较:每一个HMM模型都可以用CRF构造出来。CRF更加强大:

      1.CRF可以定义数量更多,种类更丰富的特征函数。HMM从朴素贝叶斯而来,有条件独立假设,每个观测变量只与状态变量有关。但是CRF却可以着眼于整个句子s定义更具有全局性的特征函数

      2.CRF可以使用任意的权重。将对数HMM模型看做CRF时,特征函数的权重由于是log形式的概率

      https://zhuanlan.zhihu.com/p/31187060

      1.HMM是生成模型,CRF是判别模型

      2.HMM是概率有向图,CRF是概率无向图

      3.HMM求解过程可能是局部最优,CRF可以全局最优(对数似然为凸函数)

      4.CRF概率归一化较合理,HMM则会导致label bias 问题

公众号后台回复思维导图获取完整手册(Xmind脑图源文件,学习起来更方便(ง •_•)ง

面试必备!卖萌屋算法工程师思维导图—统计机器学习篇相关推荐

  1. 卖萌屋算法工程师思维导图part3—深度学习篇

    卖萌屋的妹子们(划掉)作者团整理的算法工程师思维导图,求职/自我提升/查漏补缺神器.该手册一共分为数据结构与算法.数学基础.统计机器学习和深度学习四个部分. 下面是第三部分深度学习的内容~ 公众号后台 ...

  2. 算法工程师思维导图—数据结构与算法

    卖萌屋的妹子们(划掉)作者团整理的算法工程师思维导图,求职/自我提升/查漏补缺神器.该手册一共分为数据结构与算法.数学基础.统计机器学习和深度学习四个部分. 点击这里查看具体使用指南.该手册有两种获取 ...

  3. 本专栏所有力扣题目的目录链接, 刷算法题目的顺序(由易到难/面试频率)/注意点/技巧, 以及思维导图源文件问题(持续更新中)

    这篇文章为本专栏所有力扣题目提供目录链接, 更加方便读者根据题型或面试频率进行阅读, 此外也会介绍我在刷题过程中总结的刷算法题目的顺序/注意点/技巧, 最后说下文中出现的思维导图源文件的问题 和 打卡 ...

  4. AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典、建议收藏)之详细攻略

    AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典.建议收藏)之详细攻略 目录 机器学习算法的思维导图集合 1.ML算法思维图 2.ML算法思维导图 相关文章:ML/DL:关于算法模型的选 ...

  5. 一文总结十大经典排序算法(思维导图 + 动图演示 + 代码实现 C/C++/Python + 致命吐槽)

    声明 1)该文章整理自网上的大牛和专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除. 3)博主才疏学浅,文中如 ...

  6. 吴军《硅谷来信》思维导图笔记 - 工作篇

    2017年,在前公司领导技术经理刘总的推荐下,在得到App上订阅了吴军老师的<硅谷来信>,从此每天刷牙洗脸的时间就开始听吴军老师在大洋彼岸寄来的信件了.整个来信涵盖了职业发展.工作效率.业 ...

  7. Spring思维导图(MVC篇)

    写在前面 生活就像海洋,只有意志坚强的人才能到达彼岸. 已经很久没有发文章了呀,想必大家都挂念我了,哈哈. 温故而知新,今天一起来复习一下spring mvc的内容吧. spring mvc简介与运行 ...

  8. Spring思维导图(IOC篇)

    写在前面 写过java的都知道:所有的对象都必须创建:或者说:使用对象之前必须先创建.而使用ioc之后,你就可以不再手动创建对象,而是从ioc容器中直接获取对象. 就好像我们无需考虑对象的销毁回收一样 ...

  9. 简单易懂的英语学习思维导图(学习篇)

    当我们步入校园的时候,英语就与我们息息相关,对比数学来说,英语虽然简单点,但也不可忽略,下面是小编用思维导图整理的英语学习思维导图,让内容看起来更有条理.更好理解,一起往下看吧~ 英语学习思维导图 课 ...

最新文章

  1. 永洪科技携手华为构建金融智慧运营与商业智能方案,解决金融敏捷分析难题
  2. 二阶偏微分方程组 龙格库塔法_深度科普---电磁波(三):无激励下的真空中的Maxwell方程组的解...
  3. java语言中的类可以_java 语言中的类
  4. python下标从0开始_从零学Python之入门(三)序列
  5. mysql5.5客户端_MySQL 5.5/5.6——概述 MySQL 客户端程序
  6. java bean spring_Java bean与Spring、Spring MVC关系
  7. mysql convertgrp_Mysql中几种sql的常见用法
  8. Spark笔记整理(一):spark单机安装部署、分布式集群与HA安装部署+spark源码编译...
  9. html5的优点与缺点大概总结
  10. 开机动画,铃声添加制作
  11. LaTeX目录格式控制
  12. 智能语音呼叫中心系统
  13. matlab导入txt数据画图
  14. python布尔值print_python中的用户输入布尔值
  15. 非洲正在打造一个与硅谷完全不同的人工智能产业
  16. 持续不定期更新:CFDC++之拟一维喷管流动的数值解(2)
  17. 使用大白菜装机维护版软件取消Win7开机密码
  18. UE《空山新雨后》总结笔记
  19. 基于Python的视频中的人脸识别系统设计与实现
  20. Python数据分析高薪实战第十二天 网络服务用户流失预测分析和国产电视剧评分预测分析

热门文章

  1. How to Avoid Producing Legacy Code at the Speed of Typing
  2. [解题报告]HDU 1249 三角形
  3. Qt中的Q_OBJECT
  4. 通信PK电子,谁牛?
  5. 推荐一个值得加入C++开发者俱乐部
  6. 考研失败了,怎么办?
  7. 内存屏障,先看这篇文章
  8. 第4章 原子操作 第二节
  9. python中import os_Python常用模块os--与操作系统交互
  10. 视觉slam十四讲 pdf_视觉SLAM十四讲|第12讲 回环检测