矩阵分析理论在实际工程中的应用_机器学习中的线性代数
【妹子说】上一篇文章中讲了如何打好机器学习中的概率统计基础,那今天就再来说说线性代数的学习路径和思路吧。
没问题。
线性代数作为利用空间来投射和表征数据的基本工具,可以方便的对数据进行各种变换,从而让研究人员更为直观、清晰的探查到数据的主要特征和不同维度的所需信息。因此,线性代数的核心基础地位不言而喻,只有熟练的运用好这个工具,才能为自己搭建起攀登机器学习的牢固阶梯。
而遗憾的是,许多同学在学完线性代数课程之后,并没有太多这种感觉,留下的印象大多是一些计算方法和运算技巧,比如计算行列式、逆矩阵、矩阵的秩等等。
这也是许多其他大学数学教学的通病:风格偏理论定义和运算技巧,没有注重梳理学科内在的逻辑脉络,更没能深刻挖掘学科与当下前沿技术的交汇点,往往应付考试有余,但想以此高效的打下机器学习的数学基础,恐怕是心有余而力不足。
明确了不足之处,那就应该在传统教材的薄弱环节做突破,设计一条有针对性的学习路径:
一方面,紧紧围绕空间变换这个线性代数的主要脉络,从坐标与变换、空间与映射、近似与拟合、相似与特征、降维与压缩这五个维度,环环相扣的展开线性代数与机器学习算法紧密结合的最核心内容,深刻理解如何用空间表示数据、用空间处理数据、用空间优化数据,用一条线索拎其整个学科主干内容。
另一方面,结合机器学习中的典型实战案例,面向应用将线性代数这一数学工具用熟用好,同时以Python语言为工具进行数学思想和解决方案的有效实践,无缝对接工程应用。
【妹子说】好啦,那就按照这个思路来具体来说说该如何学习吧~
我觉得整个学习内容应该分为三大板块,核心基础、实践应用和延伸拓展,接下来我具体进行展开。
板块一:核心基础
第一部分:熟悉向量的坐标表示与空间变换
这属于搭建核心概念基础的一部分,需要从空间坐标表示与线性变换入手,快速建立线性代数直观感受,理解向量和矩阵运算的几何本质;
第二部分:了解空间与映射的本质
空间是整个线性代数的概念基石,需要能够详细去了解空间中映射和变换的本质,深入学习矩阵在其中的灵魂作用;
第三部分:学习利用矩阵进行近似与拟合
掌握线性代数在近似与拟合中的理论基础,学习最小二乘法的原理与实际应用,例如线性拟合、无解方程组的近似解问题等等;
第四部分:理解相似矩阵与特征值、特征向量的有关内容
这是矩阵分析的核心重点,我们需要深刻领会矩阵相似性的几何意义以及特征值、特征向量的提取方法,用以打好数据降维的理论基础;
第五部分:学习如何利用矩阵分解进行降维与压缩
这一部分是整个线性代数知识脉络的交汇点,可以说是矩阵分析中最为核心和高潮之处,利用前四部分打下的良好概念基础,我们应该去深入的学习特征值分解和奇异值分解的方法,并利用这些工具进行数据的压缩和降维。
整个板块一,我认为基本上能够涵盖线性代数+矩阵论在机器学习算法中所体现的知识点了。
板块二:应用实践
我认为可以利用几个小的实践项目对板块一中所讲解的知识点进行串联,尤其是特征值分解和奇异值分解这块的核心内容,我大概想了以下几个实践项目,都是非常常见的:
项目1:矩阵分解在协同过滤算法中的应用
项目2:矩阵分解在图像压缩中的应用
项目3:利用最小二乘法进行线性拟合与预测
板块三:延伸拓展
这一板块主要是做一些知识的拓展,研究的对象已经不再是线性代数本身,而是将线性代数作为一种工具去讨论一些新的话题,强化线性代数的工具属性,可以进一步开拓大家的视野,融会贯通。
第一部分:学习和比较线性代数中的基的思想与傅里叶分析的关联
第二部分:探讨如何利用傅里叶矩阵等有效工具进行离散傅里叶变换
第三部分:讨论马尔科夫链中的矩阵,以及一些相关性质
最后我还想补充一点想法,就是对于机器学习领域而言,数学是工具,是支撑,一定要用实际的应用需求来牵引知识点的学习,这样学习的目的性才会更强,更易于在需求的牵引作用下形成知识网络。
矩阵分析理论在实际工程中的应用_机器学习中的线性代数相关推荐
- python中sigmoid函数_机器学习中 Sigmoid 函数的物理含义
讨论范围:二分类问题 只有 2 个分类的情况,logistic 曲线可以简化为 又叫 sigmoid 函数. 1. Python 画 Sigmoid 函数的图像 import numpy as np ...
- 深度学习模型在训练集上很好而在测试集表现得不好而拟合次数并不多_机器学习中的过拟合,欠拟合和偏倚方差折衷...
过度拟合在机器学习中很重要. 很直观的解释过拟合:假设我们现在让机器学习考试做题,想象一种情况,机器逐字记住每个问题的答案(拟合非常好-完美).然后,我们可以在练习题上得分很高:我们这样做是基于希望实 ...
- 傅里叶描述子欧氏距离_机器学习中的各种距离
让我们一起 改变智造 hi,大家国庆都玩的怎么样啊? 是不是很诧异我现在才问候国庆的事情? 因为我今天才刚刚上班(呵呵,怎么可能) 加班加到"秃"起~ 即使这样我也要继续伴随大家去 ...
- louvian算法 缺点 优化_机器学习中的优化算法(1)-优化算法重要性,SGD,Momentum(附Python示例)...
本系列文章已转至 机器学习的优化器zhuanlan.zhihu.com 优化算法在机器学习中扮演着至关重要的角色,了解常用的优化算法对于机器学习爱好者和从业者有着重要的意义. 这系列文章先讲述优化算 ...
- 欧几里得范数_机器学习中的范数究竟是个什么鬼?
今天说一个深度学习和机器学习里面经常出现,但是未必人人都能 get 到直观感受的概念:范数,英文名叫 norm. 1.直观感受 本质上来讲,范数是用来衡量一个向量(vector)的规模的,我个人觉得中 ...
- 机器学习中用到的概率知识_机器学习中有关概率论知识的小结
一.引言 最近写了许多关于机器学习的学习笔记,里面经常涉及概率论的知识,这里对所有概率论知识做一个总结和复习,方便自己查阅,与广大博友共享,所谓磨刀不误砍柴工,希望博友们在这篇博文的帮助下,阅读机器学 ...
- 中累计直方图_试验研究中的利器强大的直方图和箱线图
上次小编给大家介绍了跟误差线有关的几个概念以及相关的柱状图,散点图,和小提琴图(试验数据统计中常用的 量,图,和线--再也不担心文章的统计用图了!).这些图和线都属于"比较统计学" ...
- 机器学习线性回归学习心得_机器学习中的线性回归
机器学习线性回归学习心得 机器学习中的线性回归 (Linear Regression in Machine Learning) There are two types of supervised ma ...
- toarray方法_机器学习中类别变量的编码方法总结
作者:louwill:转载自:机器学习实验室 在做结构化数据训练时,类别特征是一个非常常见的变量类型.机器学习中有多种类别变量编码方式,各种编码方法都有各自的适用场景和特点.本文就对机器学习中常见的类 ...
最新文章
- Python 入门篇-python3和python2的差异总结
- ajax img标签,如何将属性添加到img标签以用于ajax调用
- SpringBoot中自定义拦截器
- 北林计算机考研真题答案,真题解析|『北林』2020年考研初试真题
- java swing 动态生成表格_6 个曾经牛逼哄哄的 Java 技术,你用过吗?
- 服务器搭建php mysql5_Windows下php5+apache+mysql5 手工搭建笔记
- Ollydbg中F8的Bug
- swift版的StringAttribute
- dhcp获取i需要trunk_Cisco三层交换上给不同Vlan配置不同的DHCP
- CentOS6.5安装telnet命令
- java get请求带参数报错 java.io.IOException: Server returned HTTP response code: 400 for URL
- 【BZOJ1880】[Sdoi2009]Elaxia的路线(最短路)
- while循环--登录
- 关于网络超时时间那些事
- 【UCSC Genome Browser】- ClinGen剂量敏感性分析
- 阿米洛键盘取消win_阿米洛键盘驱动|阿米洛樱花键盘驱动下载v1.0官方版 - 欧普软件下载...
- 循环小数是分数集合吗_无限循环小数都可以化成分数吗
- 三十、再问唐僧出生之迷
- 批量ping指定端口,批量测试IP地址是否通
- 0x000000f怎么修复 win10_0xc000000f修复引导win10步骤
热门文章
- 《Armv8/armv9架构入门指南》-【第一章】- 前言
- 常见的希腊字母的发音
- 文本溢出处理和文本首行空两格解决办法
- 解决Mac安装Adobe软件的时候,总是提示安装包(软件)“可能损坏了”的问题
- 三硬币问题建模及Gibbs采样求解(Python实现)
- plc与计算机控制区别,理解plc与集散控制系统和工业控制计算机的区别.ppt
- Elasticsearch 索引生命周期管理方案
- ln(x) 泰勒级数展开
- java 64位 默认分配内存大小_JVM默认内存大小
- 安卓开发按钮触发音效替换以及系统音效和媒体音量大小进度条调节