1.我们不利用classificaion而利用regression来分类的时候会遇到的问题

在update的时候,regression因为一些噪点,或者偏离的点,逐渐将boundry远离了原本的目的函数,比如说图中的紫色和绿色。这是欧几里得距离或者说最小二乘法的一个缺点(弹幕里说)会惩罚那些太正确的点,在一边但是太过火的那些点。

理想情况怎么样呢

输入数值,输出discrete(某个种类  )。

这个的loss函数难以用gd,因为这个没有微分啊,但是有另外两个的方法

分类是用下面这个情况

这个叫做generative modle,即为(生成模型),可以generate一个x出来,可以产生distribution,可以产生一个x,sample x

先计算p(c1)和p(c2 )。从第一个Water系里面sample出来一个宝可梦的几率是0.56

挑一只水系的,可能是海龟的几率?

如果从水系里面挑一只出来,是海龟的几率到底有多少

gaussian distribution 高斯分布

输出vector是x,output是被sample出来的几率,是probability的density

同样的不同的,或者同样的,不同的都会有最高分布的不同,最高程度的一样,分布的散的不一样。

假如可以从79个点中估测出gaussian的(mean)

可以理解为由样本生成高斯分布,再用海龟的数据去找到高斯分布的位置

给一个新的点x,不在这个79个的sample里面

知道and,就可以吧gaus distribution 的 function给写出来,代入new x ,可以知道这个新的x被sample出来的几率。

怎么找这个 and ,使用的是maximum  likelihood

任何一个高斯都有可能sample出来这个值

只是有些的几率很低,有些的几率很好,但没有一个说是就等于0的,他们sample出这79个点的likelihood是不一样的,有的比较高,有的比较低。

如果给我某一个高斯,的  and ,我们就可以sample出这79个点的几率

此时有一个l,它的作用就是吧   and 代入到likelihood的function当中,之后就会告诉我们,这个   and sample出来这个79个点的几率到底有多大。

79个点是独立被sample出来的几率,所以总的几率就是sample出来每个点的几率。

现在的两个的mean和variance

现在可以 进行分类的

已知了几个概率,一个是两个高斯分布,由此可知道p(x/c1)也可以额从高斯分布中得到

可以通过颜色来分类,右边红色的被分类成为水系,左边的被分类成为普通系。因为是用几率在分类,所以大于0.5的,现在用在test上面的测试正确率只有47%。但是现在只是二维的,也许我们能够使用高维空间来解决此类问题。机器学习的牛逼的地方,就是可以在高位的空间。

可以在七维的高位空间

七维的高位空间,此时的正确率只有54%

此时来讲怎么去改进

(我觉得可以用图像识别能够去进行分类-因为种族值和到底是哪一种的关系不太大-说实话。不如看 )

不一定每一个class都有自己的一个高斯模型,比较常见的使用方法是,不同的 可以share同一个covariance matrix ,如果model都有differ 从covariance参数那么就有太多的parameter,容易过拟合。

x79里面平均起来就是   ,唯一要考虑的就是 。但是   非常简单。是使用bishop chapter4.2.2。这部分真的太抽象了。使用共同的高斯的时候,covariance matrix是这样的。

共用之后,boundary变成了一条直线,这样的boundary是一个linear(线性)的model 。此时再考虑所有的feature(7个feature)此时的正确率就变成了73%(所以是为什么呢,需要进行机器学习可解释化,炼丹之术)

哈哈哈哈为什么选这个probability distribution 是依据个人喜好的,哈哈哈哈。

如果每一个dimension,只有对角线才是1,得到一个更简单的模型,全部都在一维。朴素贝叶斯决策,各个特征独立。没有什么关系的话,甚至还有一些binary 的特征值。

这里就有sigmoid function。

其他的就不再学习了。之后再补充吧

神奇宝贝/数码宝贝分类器笔记-机器学习-李宏毅2021相关推荐

  1. 【学习笔记】李宏毅2021春机器学习课程第6.1节:生成式对抗网络 GAN(一)

    文章目录 1 能够作为生成器的神经网络 GAN 2 动漫人物头像生成 3 判别器(Discriminator) 4 从自然选择看GAN的基本思想 5 GAN 的具体实现过程 步骤一: 固定 gener ...

  2. 【学习笔记】李宏毅2021春机器学习课程第三节:卷积神经网络(CNN)

    文章目录 1 图像分类问题 2 观察一:通过某些模式来识别 3 简化一:各扫门前雪 3.1 经典的 Receptive Field 设计方式 3.1.1 看所有的 Channel 3.1.2 使用 3 ...

  3. 【学习笔记】李宏毅2021春机器学习课程第6.2节:生成式对抗网络 GAN(二)

    文章目录 1 No pain,no GAN 2 用 GAN 来生成一个 Sequence 3 怎么评估一个 Generator 的好坏 3.1 多样性问题 - Mode Collapse 3.2 多样 ...

  4. 李宏毅2021春季机器学习课程视频笔记1:Introduction, Colab PyTorch Tutorials, HW1

    诸神缄默不语-个人CSDN博文目录 李宏毅2021春季机器学习课程视频笔记集合 VX号"PolarisRisingWar"可直接搜索添加作者好友讨论. 更新日志: 2021.11. ...

  5. 【李宏毅2021机器学习深度学习】作业讲解 笔记收藏 课程主页

    作业仓库 15个作业仓库 作业参考 大佬代码参考 参考2–目前只有1-3作业? 笔记收藏 21 年 课程主页 sample code & slide 21 年笔记 20 年笔记 [<20 ...

  6. 1-2 李宏毅2021春季机器学习教程-第一节(下)-深度学习基本概念简介

    上篇文章1-1 李宏毅2021春季机器学习教程-第一节(上)-机器学习基本概念简介介绍了回归的一些知识,重点介绍了机器学习寻找函式的三个步骤.接着我们继续学习第一节Introduction的内容. 目 ...

  7. 1-4 李宏毅2021春季机器学习教程-PyTorch教学-助教许湛然

    1-3 李宏毅2021春季机器学习教程-Google Colab教学-助教许湛然介绍了Colab的使用,这篇文章是助教许湛然关于PyTorch框架的简要讲解. 更多操作查看: https://pyto ...

  8. cs224w(图机器学习)2021冬季课程学习笔记10 Applications of Graph Neural Networks

    诸神缄默不语-个人CSDN博文目录 cs224w(图机器学习)2021冬季课程学习笔记集合 文章目录 1. Graph Augmentation for GNNs 1.1 图特征增强Feature A ...

  9. 2-1 李宏毅2021春季机器学习教程-第二节机器学习任务攻略

    之前的学习简要介绍了机器学习和深度学习的相关概念,上一篇文章李宏毅2021春季机器学习教程HW1-COVID-19 Cases Prediction (Regression)解答有关于HW1的解答,接 ...

最新文章

  1. 解决:sql中将日期字符串当做日期类型处理
  2. 网站推广收录少?网站推广专员浅析可能是蜘蛛抓取出现问题
  3. oc引导windows蓝屏_人人都会遇到系统蓝屏问题,教大家自已排除蓝屏,学会一辈子受用...
  4. python pyqt5 线程 暂停 重启_PyQt5 线程阻塞?
  5. C语言:(旧)用字符串自由输入计算的计算器(加减乘除)
  6. C语言异常处理机制——为您的C程序添加异常处理
  7. WCF Data Service 创建OData服务
  8. 四、kafka整体架构
  9. 管理感悟:一种人才分类
  10. java 游戏编程 (一)
  11. jwt token注销_JWT 管理用户登录时,都需要把 token 存数据库里,判断用户登出时删除吗?...
  12. 抖音怎么加微信好友?抖音跳转微信的方法
  13. 如何写好软件项目的工作计划(一)
  14. 瑞成科技加入openKylin,推动社区生态繁荣发展!
  15. ffmpeg:制作gif / 提取视频帧为图片
  16. 英语基础太差,到底能不能学好编程?
  17. 通信工程专业就业之------通信协议栈开发(LTE/NR)
  18. 转载: 外企九年-我最终选择放弃
  19. Splashtop Wired Xdisplay在PC端闪退的解决方法
  20. java和数据库成绩管理系统,基于java与sql数据库技术的学生成绩管理系统 (4).doc...

热门文章

  1. Rolan 1.3.8 屏蔽强制更新
  2. SDR HDR 区别
  3. Win10搭建我的世界Minecraft服务器「内网穿透远程联机」
  4. 【IoT】产品设计:拼多多商业模式分析:互联网是商业模式的竞技场
  5. AM5728调试经历(2)
  6. 贵金属软件MT4好不好用?MT4软件有什么优势特点?
  7. 2023年2月京东手机品牌销量数据查询(京东电商数据平台)
  8. Python 创建商店营业额模拟数据并对其分析
  9. 我的世界基java版刷怪机制_我的世界1.8版本刷怪机制_我的世界代码1.8版本刷怪机制_快吧单机游戏...
  10. 我的世界JAVA挂机杀怪有经验_5分钟教你打造mc最简单的刷经验机!挂机就能无限经验?...