机器学习实验报告

  • 〇、实验报告pdf可在该网址下载
  • 一、实验目的与要求
  • 二、实验内容与方法
    • 2.1 LDA算法学习与回顾
      • 2.1.1 LDA原理
      • 2.1.2 LDA的算法模型
        • 二分类模型
        • 多分类模型
      • 2.1.3 LDA的优化问题
    • 2.2 LDA的算法流程
    • 2.3 LDA算法等价模型
      • 2.3.1 除法及其调换位置
      • 2.3.2 减法模型及其调换位置
      • 2.3.3 除法正则模型
      • 2.3.4 减法正则模型
  • 三、实验步骤与过程
    • 3.1 比较PCA与“LDA的各种等价模型与正则模型”的人脸识别精度
      • 3.1.1 ORL数据集下各种算法的人脸识别精度
      • 3.1.2 FERET_80数据集下各种算法的人脸识别精度
      • 3.1.3 AR人脸数据集下各种算法的人脸识别精度
    • 3.2 比较eigenface与fisherface的不同
      • 3.2.1 三个数据集降至2,3维的可视化效果图
        • PCA
        • LDA
      • 3.2.2 分析
    • 3.3 设计一个新的LDA算法
  • 四、实验结论或体会

〇、实验报告pdf可在该网址下载

机器学习实验二:LDA
这个需要积分下载(因为实验报告后台查重,不建议直接白嫖)。
建议看博客,博客里面会有很多实验报告小说明会用【…】加粗注释。

一、实验目的与要求

  1. 简述LDA 原理、算法模型与优化问题,给出全程推导细节;证明St=Sb+Sw;
  2. 给出LDA的各种等价模型表示(除法的、减法的及其调换位置的等), 在各数据集(不少于3个)比较PCA与“LDA的各种等价模型与正则模型”的人脸识别精度
  3. 比较eigenface与fisherface的不同,并取3个类的图像投影在二维和三维空间中, 并用不同颜色的点表示不同的类,每个类选3个有代表性的点对应的人脸图像显示在该点的边上(用plot命令或imshow),比较PCA与LDA的结果的不同;
  4. 参看前人论文,设计一个全新的线性鉴别分析方法或子空间学习方法,把简要内容写在本实验报告中;把长文写好提交到 ”论文提交处“;

二、实验内容与方法

2.1 LDA算法学习与回顾

2.1.1 LDA原理

根据周志华老师的《机器学习》一书中,来阐述LDA的理论。
线性判别分析(Linear Discriminant Analysis,LDA)是一种经典的线性学习方法,在二分类问题上最早由Fisher(1936)提出,亦称“Fisher判别分析”。
LDA的原理如下:
给定训练样例集,设法将样例投影到一条直线上使得同类样例的投影点尽可能接近、异类样例的投影点尽可能远离;在对新样本进行分类时,将其投影到同样的这条直线上,再根据投影点的位置来确定新的样本的类别。

2.1.2 LDA的算法模型

二分类模型

多分类模型



2.1.3 LDA的优化问题


2.2 LDA的算法流程

2.3 LDA算法等价模型

2.3.1 除法及其调换位置

2.3.2 减法模型及其调换位置

2.3.3 除法正则模型

2.3.4 减法正则模型

三、实验步骤与过程

3.1 比较PCA与“LDA的各种等价模型与正则模型”的人脸识别精度

3.1.1 ORL数据集下各种算法的人脸识别精度

ORL数据集一共40个人,采用每个人训练集为5个样本,测试集为5个样本,LDA算法先采用PCA重构阈值为90%降维再进行特征提取。KNN中使用K=5。
其中LDA算法对于最终维度的考量如下:

然后采用识别最高的最终维度来计算。
实验结果数据如下:

3.1.2 FERET_80数据集下各种算法的人脸识别精度

FERET_80数据集一共200个人,采用每个人训练集为4个样本,测试集为3个样本,LDA算法先采用PCA重构阈值为90%降维再进行特征提取。KNN中使用K=3。
其中LDA算法对于最终维度的考量如下:

然后采用识别最高的最终维度来计算。
实验结果数据如下:

3.1.3 AR人脸数据集下各种算法的人脸识别精度

AR数据集一共17个人,采用每个人训练集为4个样本,测试集为3个样本,LDA算法先采用PCA重构阈值为90%降维再进行特征提取。KNN中使用K=3。
其中LDA算法对于最终维度的考量如下:

然后采用识别最高的最终维度来计算。
实验结果数据如下:

3.2 比较eigenface与fisherface的不同

取3个类的图像投影在二维和三维空间中,并用不同颜色的点表示不同的类,每个类选3个有代表性的点对应的人脸图像显示在该点的边上(用plot命令或imshow),比较PCA与LDA的结果的异不同。

3.2.1 三个数据集降至2,3维的可视化效果图

PCA

LDA

3.2.2 分析

我们发现,对于PCA而言,数据点会比较分散,点与点之间的距离会相对较大;而对于LDA而言,同类数据点会比较集中,异类数据点会相对分散,这种比较明显的结果也反应了两种算法的思想上的侧重点。在上述实验中,相同维度的情况下,LDA之所以会比PCA的识别率更高,是因为LDA在进行人脸特征提取的时候考虑到了类标签信息,可以理解为:LDA比PCA更注重“分类的结果”,而PCA更注重“分散数据点”。所以对于分类任务而言,LDA的效果一般要优胜于PCA。

3.3 设计一个新的LDA算法

加油!!!我就不在这里献丑了!!!

四、实验结论或体会

本次实验的公式推导与证明非常重要,也在本次实验报告中体现了较大的篇幅。把LDA的各种等价模型和正则模型推导之后,也加深了我对优化问题的理解,对拉格朗日乘子法和矩阵求导的操作也更加熟练。
在实验过程中,比较了PCA与LDA及其等价模型的区别,我也发现了一个很有意思的现象,在我实验的三个数据集中,先采用PCA重构阈值为90%降维再进行LDA特征提取,会发现:使用LDA减法模型的时候发现了识别率会随着最终维度单调上升,而除法及其正则模型则是会出现一个识别率的最高点然后随着最终维度的增加识别率会大大下降。

针对本次实验,PCA与LDA的原理和实验更加透彻了。PCA求得的是一个所有样本数据点方差最大的投影;LDA求得的是同类样本尽可能接近、异类样本尽可能远离的投影。综上:LDA比PCA更注重“分类的结果”,而PCA更注重“分散数据点”。所以对于分类任务而言,LDA的效果一般要优胜于PCA。

以上就是本次实验的问题与收获。本次实验还是非常充实的,尤其在数学理论方面,再一次深刻理解数学的重要!

机器学习LDA——实验报告相关推荐

  1. 机器学习SVM——实验报告

    机器学习实验报告 〇.实验报告pdf可在该网址下载 一.实验目的与要求 二.实验内容与方法 2.1 SVM的基础概念 2.2 经典SVM的优化问题及其推导 2.3 核技巧SVM的优化问题及其推导 2. ...

  2. [HITML] 哈工大2020秋机器学习Lab1实验报告

    Gtihub仓库 不想白嫖的就来这投个币吧 2020年春季学期 计算学部<机器学习>课程 Lab1 实验报告 姓名 学号 班号 电子邮件 手机号码 1 实验目的 掌握最小二乘法求解(无惩罚 ...

  3. 机器学习聚类——实验报告

    机器学习实验报告 〇.实验报告pdf可在该网址下载 一.实验目的与要求 二.实验内容与方法 2.1 聚类算法学习与回顾 2.1.1 聚类任务 1)聚类任务的概念 2)符号定义 3)性能度量 2.1.2 ...

  4. 机器学习实验报告1——线性模型,决策树,神经网络部分

    机器学习前三次实验报告 1.线性模型 实验内容和部分实验结果: 实验1一元线性预测kaggle房价 实验2多元线性预测kaggle房价,选择多种特征进行组合,完成多元线性回归,并对比不同的特征组合,它 ...

  5. c语言回溯实验报告,实验报告: 人脸识别方法回溯与实验分析 【OpenCV测试方法源码】...

    实验报告: 人脸识别方法回顾与实验分析 [OpenCV测试方法源码] 趁着还未工作,先把过去做的东西整理下出来~ (涉及个人隐私,源码不包含测试样本,请谅解~) 对实验结果更感兴趣的朋友请直接看第5章 ...

  6. 实验报告: 人脸识别方法回顾与实验分析 【OpenCV测试方法源码】

    趁着还未工作,先把过去做的东西整理下出来~   Github源码:https://github.com/Blz-Galaxy/OpenCV-Face-Recognition (涉及个人隐私,源码不包含 ...

  7. 【学习机器学习】实验——线性模型实现

    线性模型 前言 一.实验目的 二.实验内容 1.导入数据 2.划分训练集与测试集 3.多元线性回归 3.1 多元线性回归系数矩阵 3.2 多元线性回归可视化 3.3 测试集检验 4.线性判别分析 4. ...

  8. 计算机组成原理整机实验报告,计算机组成原理加器实验报告.doc

    计算机组成原理加器实验报告 课程设计任务书 学 院信息学院专 业计算机科学与技术学生姓名学 号设计题目研制一台多累加器结构的实验计算机 内容及要求: 利用EL-JY-II型计算机组成原理实验仪提供的硬 ...

  9. 计算机组成原理语言方框图,计算机组成原理实验报告3 语言方框图

    南京信息工程大学滨江学院实验报告 实验名称 语音方框图 实验日期 2020 得分 指导教师 林美华 学院 物联网工程学院 年级专业班次 2020软件工程2班 姓名 刘旭 学号 20192346014 ...

  10. kaggle经典题--“泰坦尼克号”--0.8275准确率--东北大学20级python大作业开源(附详细解法与全部代码以及实验报告)

    kaggle经典题--"泰坦尼克号"--0.8275准确率--东北大学20级python大作业开源(附详细解法与全部代码以及实验报告) 前言 开发环境 一.导入包: 二.实验数据的 ...

最新文章

  1. QEMU-KVM自己主动创建虚拟机,以指定IP构造
  2. HTML精确定位:scrollLeft,scrollWidth,clientWidth,offsetWidth之全然具体解释
  3. 前端一HTML:十四: important
  4. Swift 绘图板功能完善以及终极优化
  5. Asp.Net MVC CodeFirst模式数据库迁移步骤
  6. python实例属性与类属性_Python中的类属性和实例属性引发的一个坑-续
  7. spingboot集成webSocket
  8. 一些Base64编码/解码及数据压缩/解压方面的知识
  9. spy-debugger 前端调试工具
  10. Python使用turtle绘制阴阳鱼图案
  11. Javascript 跨域
  12. iOS 网络请求封装
  13. java treemap get_java.util.TreeMap.get()
  14. 经典五子棋游戏项目需求文档【软件工程课程作业】
  15. 工控安全之系统加固篇
  16. 数学建模竞赛论文写作规范
  17. mongodb添加多条数据_mongodb一次能插入多少数据
  18. 电脑上的计算机可以加密码,如何给电脑上的文件夹加密
  19. STM32中的RCC是什么意思
  20. Apache Calcite 实现方言转换

热门文章

  1. 按键精灵怎么用 android,按键精灵安卓版怎么用
  2. ubuntu常用系统命令
  3. KEmulator与Eclipse搭建J2me调试平台
  4. 如何设计实时数据平台(技术篇)
  5. 数字信号处理实验一 T3
  6. Excel文件导入web页面
  7. (附源码)app订餐APP 毕业设计 190711
  8. keli下载报错,是因为没有找到相对应的型号
  9. 数据挖掘肿瘤预测_最新成年人群癌症预测模型:基于中国健康与营养调查(CHNS)数据!...
  10. qt 字体 qss加载字体_字体加载技术