文章目录

  • 什么是人工智能
    • 深度学习的崛起和AI的三次热潮
    • 人工智能发展的基石——图灵测试
    • 人工智能三大核心要素
    • 人工智能关系圈
      • 机器学习
      • 深度学习
      • 人工神经网络
  • 相关数学基础
    • 高等数学
      • 1、导数的定义
      • 2、左右导数的几何意义和物理意义
      • 3、函数的可导性与连续性之间的关系
      • 4、平面曲线的切线与法线
      • 5、四则运算法则
      • 6、基本导数与微分表
      • 7、复合函数,反函数,隐函数以及参数方程所确定的函数的微分法
      • 8、常用高阶导数公式
      • 9、微分中值定理
      • 10、洛必达法则
      • 11、泰勒公式
      • 12、函数单调性的判断
      • 13、渐近线的求法
      • 14、函数凹凸性的判断
      • 15、弧微分
      • 16、曲率
      • 17、曲率半径
    • 线性代数
      • 行列式
        • 1、行列式按行(列)展开定理
      • 矩阵
        • 矩阵的线性运算
          • 1、矩阵的加法
          • 2、矩阵的数乘
          • 3、矩阵的乘法
          • 4、AT,A−1,A∗A^T,A^{-1},A^\astAT,A−1,A∗三者之间的关系
          • 5、有关A∗A^\astA∗的结论
          • 6、有关A−1A^{-1}A−1的结论
          • 7、有关矩阵秩的结论
          • 8、分块求逆公式
      • 向量
        • 1、有关向量组的线性表示
        • 2、有关向量组的线性相关性
        • 3、向量组的秩与矩阵的秩之间的关系
        • 4、nnn维向量空间的基变换公式及过渡矩阵
        • 5、坐标变换公式
        • 6、向量的内积
        • 7、Schmidt正交化
        • 8、正交基及规范正交基
      • 线性方程组
        • 1、克莱姆法则
        • 2、Ax=0Ax=0Ax=0解的情况
        • 3、非其次性方程组有解的充分必要条件,线性方程组解的性质和解的结构
        • 4、齐次线性方程组的基础解系和通解,解空间,非齐次线性方程组的通解
      • 矩阵的特征值与特征向量
        • 1、矩阵的特征值和特征向量的概念及性质
        • 2、相似变换、相似矩阵的概念及性质
        • 3、矩阵可相似对角化的充分必要条件
        • 4、实对称矩阵的特征值、特征向量及相似对角阵
      • 二次型
        • 1、nnn个变量x1,x2,⋯xnx_1,x_2,\cdots x_nx1​,x2​,⋯xn​的二次齐次函数
        • 2、惯性定理,二次型标准形和规范形
        • 3、用正交变换和配方法化二次型为标准形,二次型及其矩阵的正定性
    • 概率与数理统计
      • 随机事件和概率
        • 1、事件的关系与运算
        • 2、运算律
        • 3、德.摩根律
        • 4、完全事件组
        • 5、概率的基本概念
        • 6、概率的基本公式
        • 7、事件的独立性
        • 8、独立重复试验
        • 9、重要公式与结论
      • 随机变量及其概率分布
        • 1、随机变量及概率分布
        • 2、分布函数的概念与性质
        • 3、离散型随机概率变量的概率分布
        • 4、连续型随机概率变量的概率分布
        • 5、常见分布
        • 6、随机变量函数的概率分布
        • 7、重要公式与结论
      • 多维随机变量及其分布
        • 1、二维随机变量及其联合分布
        • 2、二维离散随机变量的分布
        • 3、二维连续性随机变量的密度
        • 4、常见二维随机变量的联合分布
        • 5、随机变量的独立性和相关性
        • 6、两个随机变量简单函数的概率分布
        • 7、重要公式与结论
      • 随机变量的数字特征
        • 1、数学期望
        • 2、方差、标准差
        • 3、随机变量函数的数学期望
        • 4、协方差
        • 5、相关系数
        • 6、重要公式与结论
      • 数理统计的基本概念
        • 1、基本概念
        • 2、分布
        • 3、正态总体的常用样本分布
        • 4、重要公式与结论

什么是人工智能

对于人工智能的定义,学界一直有不同的表述,一种被广泛接受的说法是:人工智能是通过机器来模拟人类认知能力的技术。人工智能设计很广,涵盖了感知、学习、推理和决策等方面的能力。从实际应用的角度来说,人工智能最核心的能力就是根据给定的输入做出判断或预测

深度学习的崛起和AI的三次热潮

1956年,达特茅斯会议标志着AI的诞生;
1957年,第一款神经网络Perceptron发明,AI到达第一个高峰期;
1974年,计算能力突破没能使机器完成大规模数据训练和复杂任务,AI进入第一个低谷;
1982年,霍普菲尔德神经网络被提出,在其中引入了相关联存储的机制;
1986年,BP算法出现使得大规模神经网络的训练成为可能,AI迎来第二个黄金期;
1990年,人工智能计算机DARPA没能实现政府投入缩减,AI进入第二次低谷;
2006年,Hinton提出深度学习神经网络使得AI性能获得突破性进展;
2012年,深度学习算法在语音和视觉识别上取得成功,AI进入感知智能时代。

第一次热潮:20世纪50年代,神经网络相关基础理论的提出;
第二次热潮:20世纪80年代,算法应用升级;
第三次热潮:2006年深度学习(深度神经网络)基本理论框架得到了验证,得益于海量数据处理能力的成熟,深度学习相关技术崛起。

人工智能发展的基石——图灵测试

图灵测试(The Turing test)由艾伦·麦席森·图灵发明,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。

人工智能三大核心要素

数据:必须要有大数据;
算法:学习算法的设计,你设计的大脑到底够不够聪明;
算力:要有高性能的计算能力,训练一个大的网络;

人工智能关系圈

机器学习

机器学习是一种实现人工智能的方法。是一门多领域交叉学科,设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用回归、综合而不是演绎。

深度学习

深度学习是一种实现机器学习的技术。是利用深度的神经网络,将模型处理的更为复杂,从而使模型对数据的理解更加深入,是机器学习中一种基于对数据进行表征学习的方法。其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来进行解释数据,例如图像、声音和文本。深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。

人工神经网络

人工神经网络是一种机器学习的算法。神经网络一般有输入层、隐藏层、输出层,一般来说隐藏层数量多于两层的网络就叫做深度神经网络,深度学习就是采用想深度神经网络这层深层架构的一种机器学习方法。

相关数学基础

高等数学

1、导数的定义

导数与微分的概念:
f′(x0)=lim⁡Δx→0f(x0+Δx)−f(x0)Δxf'(x_0)=\lim_{\Delta x\rightarrow0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}f′(x0​)=limΔx→0​Δxf(x0​+Δx)−f(x0​)​
或者:f′(x0)=lim⁡x→x0f(x)−f(x0)x−x0f'(x_0)=\lim_{x\rightarrow x_0}\frac{f(x)-f(x_0)}{x-x_0}f′(x0​)=limx→x0​​x−x0​f(x)−f(x0​)​

2、左右导数的几何意义和物理意义

函数f(x)f(x)f(x)在x0x_0x0​处的左右导数分别定义为:
左导数:f′_(x0)=lim⁡Δx→0−f(x0+Δx)−f(x0)Δx=lim⁡x→x0−f(x)−f(x0)x−x0,(x=x0+Δx)f'\_(x_0)=\lim_{\Delta x\rightarrow0^-}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}=\lim_{x\rightarrow x_0^-}\frac{f(x)-f(x_0)}{x-x_0},(x=x_0+\Delta x)f′_(x0​)=limΔx→0−​Δxf(x0​+Δx)−f(x0​)​=limx→x0−​​x−x0​f(x)−f(x0​)​,(x=x0​+Δx)
右导数:f+′(x0)=lim⁡Δx→0+f(x0+Δx)−f(x0)Δx=lim⁡x→x0+f(x)−f(x0)x−x0f'_+(x_0)=\lim_{\Delta x\rightarrow0^+}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}=\lim_{x\rightarrow x_0^+}\frac{f(x)-f(x_0)}{x-x_0}f+′​(x0​)=limΔx→0+​Δxf(x0​+Δx)−f(x0​)​=limx→x0+​​x−x0​f(x)−f(x0​)​

3、函数的可导性与连续性之间的关系

Th1:函数f(x)f(x)f(x)在x0x_0x0​处可微⇔\Leftrightarrow⇔f(x)f(x)f(x)在x0x_0x0​处可导。
Th2:若函数在点x0x_0x0​处可导,则y=f(x)y=f(x)y=f(x)在点x0x_0x0​处连续,反之则不一定成立,即函数连续不一定可导。
Th3:f(x0)f(x_0)f(x0​)存在,则f−′(x0)=f+′(x0)f'_-(x_0)=f'_+(x_0)f−′​(x0​)=f+′​(x0​)。

4、平面曲线的切线与法线

切线方程:y−y0=f′(x0)(x−x0)y-y_0=f'(x_0)(x-x_0)y−y0​=f′(x0​)(x−x0​)
法线方程:y−y0=−1f′(x0)(x−x0),f′(x0)≠0y-y_0=-\frac1{f'(x_0)}(x-x_0),f'(x_0)\neq0y−y0​=−f′(x0​)1​(x−x0​),f′(x0​)​=0

5、四则运算法则

设函数u=u(x),v=v(x)u=u(x),v=v(x)u=u(x),v=v(x)在点xxx处可导,则:
(1)(u±v)′=u′±v′{(u\pm v)}'=u'\pm v'(u±v)′=u′±v′
(2)(uv)′=uv′+vu′{(uv)}'=uv'+vu'(uv)′=uv′+vu′ \;\;\;\;\;\;\;\;\;\;\;\; d(uv)=udv+vdud(uv)=udv+vdud(uv)=udv+vdu
(3)(uv)′=uv′−vu′v2(v≠0){(\frac uv)}'=\frac{uv'-vu'}{v^2}(v\neq0)(vu​)′=v2uv′−vu′​(v​=0) \;\;\;\;\;\; d(uv)=vdu−udvv2d(\frac uv)=\frac{vdu-udv}{v^2}d(vu​)=v2vdu−udv​

6、基本导数与微分表

(1)y=cy=cy=c(常数),则y′=0dy=0y'=0\;\;\;\;\;dy=0y′=0dy=0
(2)y=xαy=x^\alphay=xα(α\alphaα为实数),则y′=0dy=0y'=0\;\;\;\;\;dy=0y′=0dy=0
(3)y=αxy=\alpha^xy=αx(α\alphaα常数),则y′=αxln⁡αdy=αxln⁡αdxy'=\alpha^x\ln\alpha\;\;\;dy=\alpha^x\ln\alpha dxy′=αxlnαdy=αxlnαdx \;特例(ex)′=exd(ex)=exdx(e^x)'=e^x\;\;d(e^x)=e^xdx(ex)′=exd(ex)=exdx
(4)y=log⁡axy=\log_axy=loga​x(α\alphaα常数),则y′=1xln⁡ady=1xln⁡adxy'=\frac1{x\ln a}\;\;\;\;\;dy=\frac1{x\ln a}dxy′=xlna1​dy=xlna1​dx \;特例(ln⁡x)′=1xd(ln⁡x)=1xdx(\ln x)'=\frac1x\;\;d(\ln x)=\frac1xdx(lnx)′=x1​d(lnx)=x1​dx
(5)y=sinxy=sinxy=sinx,则y′=cosxd(sinx)=cosxdxy'=cosx\;\;\;\;\;d(sinx)=cosxdxy′=cosxd(sinx)=cosxdx
(6)y=cosxy=cosxy=cosx,则y′=−sinxd(cosx)=−sinxdxy'=-sinx\;\;\;\;\;d(cosx)=-sinxdxy′=−sinxd(cosx)=−sinxdx
(7)y=tanxy=tanxy=tanx,则y′=1cos⁡2x=sec2xd(tan⁡x)=sec2xdxy'=\frac1{\cos^2x}=sec^2x\;\;d(\tan x)=sec^2xdxy′=cos2x1​=sec2xd(tanx)=sec2xdx
(8)y=cotxy=cotxy=cotx,则y′=−1sin⁡2x=−csc2xd(cot⁡x)=−csc2xdxy'=-\frac1{\sin^2x}=-csc^2x\;\;d(\cot x)=-csc^2xdxy′=−sin2x1​=−csc2xd(cotx)=−csc2xdx
(9)y=secxy=secxy=secx,则y′=secxtanxd(secx)=secxtanxdxy'=secxtanx\;\;\;\;\;d(secx)=secxtanxdxy′=secxtanxd(secx)=secxtanxdx
(10)y=cscxy=cscxy=cscx,则y′=−cscxcotxd(cscx)=−cscxcotxdxy'=-cscxcotx\;\;\;\;\;d(cscx)=-cscxcotxdxy′=−cscxcotxd(cscx)=−cscxcotxdx
(11)y=arcsin⁡xy=arc\sin xy=arcsinx,则y′=11−x2d(arcsin⁡x)=11−x2dxy'=\frac1{\sqrt{1-x^2}}\;\;d(arc\sin x)=\frac1{\sqrt{1-x^2}}dxy′=1−x2​1​d(arcsinx)=1−x2​1​dx
(12)y=arccos⁡xy=arc\cos xy=arccosx,则y′=−11−x2d(arccos⁡x)=−11−x2dxy'=-\frac1{\sqrt{1-x^2}}\;\;d(arc\cos x)=-\frac1{\sqrt{1-x^2}}dxy′=−1−x2​1​d(arccosx)=−1−x2​1​dx
(13)y=arctan⁡xy=arc\tan xy=arctanx,则y′=11+x2d(arctan⁡x)=11+x2dxy'=\frac1{1+x^2}\;\;d(arc\tan x)=\frac1{1+x^2}dxy′=1+x21​d(arctanx)=1+x21​dx
(14)y=arccot⁡xy=arc\cot xy=arccotx,则y′=−11+x2d(arccot⁡x)=−11+x2dxy'=-\frac1{1+x^2}\;\;d(arc\cot x)=-\frac1{1+x^2}dxy′=−1+x21​d(arccotx)=−1+x21​dx
(15)y=shxy=shxy=shx,则y′=chxd(shx)=chxdxy'=chx\;\;\;\;\;d(shx)=chxdxy′=chxd(shx)=chxdx
(15)y=chxy=chxy=chx,则y′=shxd(chx)=shxdxy'=shx\;\;\;\;\;d(chx)=shxdxy′=shxd(chx)=shxdx

7、复合函数,反函数,隐函数以及参数方程所确定的函数的微分法

(1)反函数的运算法则,设y=f(x)y=f(x)y=f(x)在点xxx的某淋雨内单调连续,则点xxx处可到且f′(x0)≠0f'(x_0)\neq0f′(x0​)​=0,则其反函数在点xxx所对应的yyy处可到,并且有dydx=1dxdy\frac{dy}{dx}=\frac1{\displaystyle\frac{dx}{dy}}dxdy​=dydx​1​;
(2符合函数的运算法则:若μ=φ(x)\mu=\varphi(x)μ=φ(x)在点xxx可导,而y=f(μ)y=f(\mu)y=f(μ)在对应点μ(u=φ(x))\mu(u=\varphi(x))μ(u=φ(x))可导,则复合函数y=f(φ(x))y=f(\varphi(x))y=f(φ(x))在点xxx可导,且y′=f′(u)φ′(x)y'=f'(u)\varphi'(x)y′=f′(u)φ′(x)
(3隐函数导数dydx\frac{dy}{dx}dxdy​的求法一般有三种方法:
1)方程两边对xxx求导,要记住yyy是xxx的导数,则yyy的函数是xxx的复合函数,例如1y,y2,ln⁡y,ey\frac1y,y^2,\ln y,e^yy1​,y2,lny,ey等均是xxx的复合函数,对xxx求导应按照复合函数连锁法则做;
2)公式法,由F(x,y)=0F(x,y)=0F(x,y)=0知dydx=−Fx′(x,y)Fy′(x,y)\frac{dy}{dx}=-\frac{F'_x(x,y)}{F'_y(x,y)}dxdy​=−Fy′​(x,y)Fx′​(x,y)​,其中,Fx′(x,y),Fy′(x,y)F'_x(x,y),F'_y(x,y)Fx′​(x,y),Fy′​(x,y)分别表示F(x,y)F(x,y)F(x,y)对xxx和yyy的偏导数;
3)利用微分形式不变性

8、常用高阶导数公式

(1)(ax)(n)=axln⁡na(a>0)(ex)(n)=ex{(a^x)}^{(n)}=a^x\ln^na\;\;(a>0)\;\;\;\;\;\;{(e^x)}^{(n)}=e^x(ax)(n)=axlnna(a>0)(ex)(n)=ex
(2)(sin⁡dx)(n)=knsin⁡(kx+n⋅π2){(\sin dx)}^{(n)}=k^n\sin(kx+n\cdot\frac\pi2)(sindx)(n)=knsin(kx+n⋅2π​)
(3)(cos⁡dx)(n)=kncos⁡(kx+n⋅π2){(\cos dx)}^{(n)}=k^n\cos(kx+n\cdot\frac\pi2)(cosdx)(n)=kncos(kx+n⋅2π​)
(4)(xm)(n)=m(m−1)⋯(m−n+1)xm−n{(x^m)}^{(n)}=m(m-1)\cdots(m-n+1)x^{m-n}(xm)(n)=m(m−1)⋯(m−n+1)xm−n
(5)(ln⁡x)(n)=(−1)(n−1)(n−1)!xn{(\ln x)}^{(n)}={(-1)}^{(n-1)}\frac{(n-1)!}{x^n}(lnx)(n)=(−1)(n−1)xn(n−1)!​
(6)莱布尼兹公式:若u(x),v(x)u(x),v(x)u(x),v(x)均为nnn阶可导,则,(uv)(n)=∑i=0ncniu(i)v(n−i){(uv)}^{(n)}={\textstyle\sum_{i=0}^n}c_n^iu^{(i)}v^{(n-i)}(uv)(n)=∑i=0n​cni​u(i)v(n−i),其中u(0)=u,v(0)=vu^{(0)}=u,v^{(0)}=vu(0)=u,v(0)=v

9、微分中值定理

Th1:费马定理
若函数f(x)f(x)f(x)满足条件:
(1)函数f(x)f(x)f(x)在x0x_0x0​的某邻域内有定义,并且在此邻域内恒有f(x)≤f(x0)f(x)\leq f(x_0)f(x)≤f(x0​)或f(x)≥f(x0)f(x)\geq f(x_0)f(x)≥f(x0​),
(2)f(x)f(x)f(x)在x0x_0x0​处可导,则有f′(x0)=0f'(x_0)=0f′(x0​)=0。
Th2:罗尔定理
设函数f(x)f(x)f(x)满足条件:
(1)在闭区间[a,b][a,b][a,b]上连续; (2)在(a,b)(a,b)(a,b)上可导; (3)f(a)=f(b)f(a)=f(b)f(a)=f(b)
则在(a,b)(a,b)(a,b)内∃\exists∃一个ξ\xiξ,使f′(ξ)=0f'(\xi)=0f′(ξ)=0。
Th3:拉格朗日中值定理
设函数f(x)f(x)f(x)满足条件:
(1)在闭区间[a,b][a,b][a,b]上连续; (2)在(a,b)(a,b)(a,b)上可导;
则在(a,b)(a,b)(a,b)内∃\exists∃一个ξ\xiξ,使f(b)−f(a)b−a=f′(ξ)\frac{f(b)-f(a)}{b-a}=f'(\xi)b−af(b)−f(a)​=f′(ξ)。
Th4:柯西中值定理
设函数f(x),g(x)f(x),g(x)f(x),g(x)满足条件:
(1)在闭区间[a,b][a,b][a,b]上连续; (2)在(a,b)(a,b)(a,b)上可导且f′(x),g′(x)f'(x),g'(x)f′(x),g′(x)均存在,且g′(x)≠0g'(x)\neq0g′(x)​=0;
则在(a,b)(a,b)(a,b)内存在一个ξ\xiξ,使f(b)−f(a)f(b)−g(a)=f(ξ)g(ξ)\frac{f(b)-f(a)}{f(b)-g(a)}=\frac{f(\xi)}{g(\xi)}f(b)−g(a)f(b)−f(a)​=g(ξ)f(ξ)​。

10、洛必达法则

法则I\IotaI(00\frac0000​型不定式极限)
设函数f(x),g(x)f(x),g(x)f(x),g(x)满足条件:lim⁡x→x0f(x)=0,lim⁡x→x0g(x)=0\lim_{x\rightarrow x_0}f(x)=0,\lim_{x\rightarrow x_0}g(x)=0limx→x0​​f(x)=0,limx→x0​​g(x)=0;f(x),g(x)f(x),g(x)f(x),g(x)在x0x_0x0​的邻域内可导(在x0x_0x0​处可除外)且g′(x)≠0g'(x)\neq0g′(x)​=0;lim⁡x→x0f′(x)g′(x)\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}limx→x0​​g′(x)f′(x)​存在(或∞\infty∞)。
则lim⁡x→x0f(x)g(x)=lim⁡x→x0f′(x)g′(x)\lim_{x\rightarrow x_0}\frac{f(x)}{g(x)}=\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}limx→x0​​g(x)f(x)​=limx→x0​​g′(x)f′(x)​。
法则I\IotaI(00\frac0000​型不定式极限)
设函数f(x),g(x)f(x),g(x)f(x),g(x)满足条件:lim⁡x→x0f(x)=0,lim⁡x→x0g(x)=0\lim_{x\rightarrow x_0}f(x)=0,\lim_{x\rightarrow x_0}g(x)=0limx→x0​​f(x)=0,limx→x0​​g(x)=0;存在一个X>0X>0X>0,当∣x∣>X|x|>X∣x∣>X时,f(x),g(x)f(x),g(x)f(x),g(x)可导,且g′(x)≠0g'(x)\neq0g′(x)​=0;lim⁡x→x0f′(x)g′(x)\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}limx→x0​​g′(x)f′(x)​存在(或∞\infty∞)。
则lim⁡x→x0f(x)g(x)=lim⁡x→x0f′(x)g′(x)\lim_{x\rightarrow x_0}\frac{f(x)}{g(x)}=\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}limx→x0​​g(x)f(x)​=limx→x0​​g′(x)f′(x)​。
法则II\Iota\IotaII(∞∞\frac\infty\infty∞∞​型不定式极限)
设函数f(x),g(x)f(x),g(x)f(x),g(x)满足条件:lim⁡x→x0f(x)=∞,lim⁡x→x0g(x)=∞\lim_{x\rightarrow x_0}f(x)=\infty,\lim_{x\rightarrow x_0}g(x)=\inftylimx→x0​​f(x)=∞,limx→x0​​g(x)=∞;f(x),g(x)f(x),g(x)f(x),g(x)在x0x_0x0​的邻域内可导(在x0x_0x0​处可除外)且g′(x)≠0g'(x)\neq0g′(x)​=0;lim⁡x→x0f′(x)g′(x)\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}limx→x0​​g′(x)f′(x)​存在(或∞\infty∞)。
则lim⁡x→x0f(x)g(x)=lim⁡x→x0f′(x)g′(x)\lim_{x\rightarrow x_0}\frac{f(x)}{g(x)}=\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}limx→x0​​g(x)f(x)​=limx→x0​​g′(x)f′(x)​。
同理法则法则II’\Iota\Iota’II’(∞∞\frac\infty\infty∞∞​型不定式极限)仿法则I′\Iota'I′写出。

11、泰勒公式

设函数f(x)f(x)f(x)在x0x_0x0​处的某邻域内具有n+1n+1n+1阶导数,则对该淋浴内异于x0x_0x0​的任意点x,在x0x_0x0​于xxx之间至少存在一个ξ\xiξ,使得:
f(x)=f(x0)+f′(x0)(x−x0)+12!f′′(x0)(x−x0)2+⋯+f(n)(x0)n!(x−x0)n+Rn(x)f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac1{2!}f''(x_0){(x-x_0)}^2+\cdots+\frac{f^{(n)}(x_0)}{n!}{(x-x_0)}^n+R_n(x)f(x)=f(x0​)+f′(x0​)(x−x0​)+2!1​f′′(x0​)(x−x0​)2+⋯+n!f(n)(x0​)​(x−x0​)n+Rn​(x)
其中Rn(x)=f(n+1)(ξ)(n+1)!(x−x0)n+1R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}{(x-x_0)}^{n+1}Rn​(x)=(n+1)!f(n+1)(ξ)​(x−x0​)n+1称为f(x)f(x)f(x)在点x0x_0x0​处的n阶泰勒余项。
令x0=0x_0=0x0​=0,则nnn阶泰勒公式:
f(x)=f(0)+f′(0)x+12!f′′(0)x2+⋯+f(n)(0)n!xn+Rn(x)⋯⋯f(x)=f(0)+f'(0)x+\frac1{2!}f''(0)x^2+\cdots+\frac{f^{(n)}(0)}{n!}x^n+R_n(x)\cdots\cdotsf(x)=f(0)+f′(0)x+2!1​f′′(0)x2+⋯+n!f(n)(0)​xn+Rn​(x)⋯⋯
(1)其中Rn(x)=f(n+1)(ξ)(n+1)!xn+1R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}{x}^{n+1}Rn​(x)=(n+1)!f(n+1)(ξ)​xn+1,ξ\xiξ在000和xxx之间。(1)式称为麦克劳林公式。
常用五中函数在x0=0x_0=0x0​=0处的泰勒公式:
1)ex=1+x+12!x2+⋯+1n!xn+xn+1(n+1)!eξe^x=1+x+\frac1{2!}x^2+\cdots+\frac1{n!}x^n+\frac{x^{n+1}}{(n+1)!}e^\xiex=1+x+2!1​x2+⋯+n!1​xn+(n+1)!xn+1​eξ
或ex=1+x+12!x2+⋯+1n!xn+o(xn)e^x=1+x+\frac1{2!}x^2+\cdots+\frac1{n!}x^n+o(x^n)ex=1+x+2!1​x2+⋯+n!1​xn+o(xn)
2)sin⁡x=x−13!x3+⋯+xnn!sin⁡nπ2+xn+1(n+1)!sin⁡(ξ+n+12π)\sin x=x-\frac1{3!}x^3+\cdots+\frac{x^n}{n!}\sin\frac{n\pi}2+\frac{x^{n+1}}{(n+1)!}\sin(\xi+\frac{n+1}2\pi)sinx=x−3!1​x3+⋯+n!xn​sin2nπ​+(n+1)!xn+1​sin(ξ+2n+1​π)
或sin⁡x=x−13!x3+⋯+xnn!sin⁡nπ2+o(xn)\sin x=x-\frac1{3!}x^3+\cdots+\frac{x^n}{n!}\sin\frac{n\pi}2+o(x^n)sinx=x−3!1​x3+⋯+n!xn​sin2nπ​+o(xn)
3)cos⁡x=x−12!x2+⋯+xnn!cos⁡nπ2+xn+1(n+1)!cos⁡(ξ+n+12π)\cos x=x-\frac1{2!}x^2+\cdots+\frac{x^n}{n!}\cos\frac{n\pi}2+\frac{x^{n+1}}{(n+1)!}\cos(\xi+\frac{n+1}2\pi)cosx=x−2!1​x2+⋯+n!xn​cos2nπ​+(n+1)!xn+1​cos(ξ+2n+1​π)
或cos⁡x=x−12!x2+⋯+xnn!cos⁡nπ2+o(xn)\cos x=x-\frac1{2!}x^2+\cdots+\frac{x^n}{n!}\cos\frac{n\pi}2+o(x^n)cosx=x−2!1​x2+⋯+n!xn​cos2nπ​+o(xn)
4)ln⁡(1+x)=x−12!x2+13!x3−⋯+(−1)nxnn!+(−1)nxn(n+1)(1+ξ)n+1\ln(1+x)=x-\frac1{2!}x^2+\frac1{3!}x^3-\cdots+{(-1)}^n\frac{x^n}{n!}+\frac{{(-1)}^nx^n}{(n+1){(1+\xi)}^{n+1}}ln(1+x)=x−2!1​x2+3!1​x3−⋯+(−1)nn!xn​+(n+1)(1+ξ)n+1(−1)nxn​
或ln⁡(1+x)=x−12!x2+13!x3−⋯+(−1)nxnn!+o(xn)\ln(1+x)=x-\frac1{2!}x^2+\frac1{3!}x^3-\cdots+{(-1)}^n\frac{x^n}{n!}+o(x^n)ln(1+x)=x−2!1​x2+3!1​x3−⋯+(−1)nn!xn​+o(xn)
5)(1+x)m=1+mx+m(m−1)2!x2+⋯+m(m−1)⋯(m−n+1)n!xn+m(m−1)⋯(m−n+1)(n+1)!xn+1(1+ξ)m−n−1{(1+x)}^m=1+mx+\frac{m(m-1)}{2!}x^2+\cdots+\frac{m(m-1)\cdots(m-n+1)}{n!}x^n+\frac{m(m-1)\cdots(m-n+1)}{(n+1)!}x^{n+1}{(1+\xi)}^{m-n-1}\;(1+x)m=1+mx+2!m(m−1)​x2+⋯+n!m(m−1)⋯(m−n+1)​xn+(n+1)!m(m−1)⋯(m−n+1)​xn+1(1+ξ)m−n−1
或(1+x)m=1+mx+m(m−1)2!x2+⋯+m(m−1)⋯(m−n+1)n!xn+o(xn){(1+x)}^m=1+mx+\frac{m(m-1)}{2!}x^2+\cdots+\frac{m(m-1)\cdots(m-n+1)}{n!}x^n+o(x^n)(1+x)m=1+mx+2!m(m−1)​x2+⋯+n!m(m−1)⋯(m−n+1)​xn+o(xn)

12、函数单调性的判断

Th1:设函数f(x)f(x)f(x)在(a,b)(a,b)(a,b)区间内可导,如果对∀x∈(a,b)\forall x\in(a,b)∀x∈(a,b),都有f′(x)>0f'(x)>0f′(x)>0(或f′(x)<0f'(x)<0f′(x)<0),则函数f(x)f(x)f(x)在(a,b)(a,b)(a,b)内是单调增加的(或单调减少的)。
Th2:(取极值得必要条件)设f(x)f(x)f(x)在x0x_0x0​处可导,且在x0x_0x0​处取极值,则f′(x0)>0f'(x_0)>0f′(x0​)>0。
Th3:(取极值的第一充分条件)设f(x)f(x)f(x)在x0x_0x0​的某一邻域内可微,且f′(x0)=0f'(x_0)=0f′(x0​)=0(或f(x)f(x)f(x)在x0x_0x0​处连续,但f′(x0)=0f'(x_0)=0f′(x0​)=0不存在):
(1)当xxx经过x0x_0x0​时,f′(x)f'(x)f′(x)由"+""+""+"变"−""-""−",则f(x0)f(x_0)f(x0​)为极大值;
(2)当xxx经过x0x_0x0​时,f′(x)f'(x)f′(x)由"−""-""−"变"+""+""+",则f(x0)f(x_0)f(x0​)为极小值;
(2)当f′(x)f'(x)f′(x)经过x=x0x=x_0x=x0​的两侧不变号,则f(x0)f(x_0)f(x0​)不是极值;
Th4:(取极值的第二充分条件)设f(x)f(x)f(x)在x0x_0x0​处有f′′(x0)≠0f''(x_0)\neq0f′′(x0​)​=0,且f′(x)=0f'(x)=0f′(x)=0,则:
当f′′(x0)<0f''(x_0)<0f′′(x0​)<0时,f(x0)f(x_0)f(x0​)为极大值;当f′′(x0)>0f''(x_0)>0f′′(x0​)>0时,f(x0)f(x_0)f(x0​)为极小值。注:如果f′′(x0)=0f''(x_0)=0f′′(x0​)=0,此方法失效。

13、渐近线的求法

(1)水平渐近线
若lim⁡x→+∞f(x)=b\lim_{x\rightarrow+\infty}f(x)=blimx→+∞​f(x)=b,或lim⁡x→−∞f(x)=b\lim_{x\rightarrow-\infty}f(x)=blimx→−∞​f(x)=b,则称y=by=by=b为函数y=f(x)y=f(x)y=f(x)的水平渐近线。
(2)铅直渐近线
若lim⁡x→x0−f(x)=∞\lim_{x\rightarrow x_0^-}f(x)=\inftylimx→x0−​​f(x)=∞,或lim⁡x→x0+f(x)=∞\lim_{x\rightarrow x_0^+}f(x)=\inftylimx→x0+​​f(x)=∞,则称x=x0x=x_0x=x0​为函数y=f(x)y=f(x)y=f(x)的铅直渐近线。
(2)斜渐近线
若a=lim⁡x→∞f(x)x,b=lim⁡x→∞[f(x)−ax]a=\lim_{x\rightarrow\infty}\frac{f(x)}x,b=\lim_{x\rightarrow\infty}\lbrack f(x)-ax\rbracka=limx→∞​xf(x)​,b=limx→∞​[f(x)−ax],则称y=ax+by=ax+by=ax+b为函数y=f(x)y=f(x)y=f(x)的斜渐近线。

14、函数凹凸性的判断

Th1:(凹凸性的判别定理)若在I\IotaI上f′′(x)<0f''(x)<0f′′(x)<0(或f′′(x)>0f''(x)>0f′′(x)>0),则f(x)f(x)f(x)在I\IotaI时凸(或凹)的。
Th2:(拐点的判别定理1)若在x0x_0x0​处f′′(x)=0f''(x)=0f′′(x)=0,(或f′′(x)f''(x)f′′(x)不存在),当xxx变动经过x0x_0x0​时,f′′(x)f''(x)f′′(x)变号,则(x0,f(x0))(x_0,f(x_0))(x0​,f(x0​))为拐点。
Th2:(拐点的判别定理2)设f(x)f(x)f(x)在x0x_0x0​点的某邻域内有三阶导数,且f′′(x)=0,f′′’(x)≠0f''(x)=0,f''’(x)\neq0f′′(x)=0,f′′’(x)​=0,则(x0,f(x0))(x_0,f(x_0))(x0​,f(x0​))为拐点。

15、弧微分

dS=1+y2dxdS=\sqrt{1+y^2}dxdS=1+y2​dx

16、曲率

曲线y=f(x)y=f(x)y=f(x)在点(x,y)(x,y)(x,y)处的曲率k=∣y′′∣(1+y′2)3/2k=\frac{\vert y''\vert}{{(1+y'^2)}^{3/2}}k=(1+y′2)3/2∣y′′∣​,对于参数方程:
{x=φ(t)y=ψ(t),k=∣φ′(t)ψ′′(t)−φ′′(t)ψ′(t)∣(φ′2(t)+ψ/′2(t))3/2\left\{\begin{array}{l}x=\varphi(t)\\y=\psi(t)\end{array}\right.,k=\frac{\vert\varphi'(t)\psi''(t)-\varphi''(t)\psi'(t)\vert}{(\varphi'^2(t)+\psi/'^2{(t))}^{3/2}}{x=φ(t)y=ψ(t)​,k=(φ′2(t)+ψ/′2(t))3/2∣φ′(t)ψ′′(t)−φ′′(t)ψ′(t)∣​

17、曲率半径

曲线在点MMM处的曲率k(k≠0)k(k\neq0)k(k​=0)与曲线在点MMM处的曲率半径ρ\rhoρ有如下关系:ρ=1k\rho=\frac1kρ=k1​。

线性代数

行列式

1、行列式按行(列)展开定理

(1)设A=(aij)n×nA={(a_{ij})}_{n\times n}A=(aij​)n×n​,则ai1Aj1+ai2Aj2+⋯+ainAjn={∣A∣,i=j0,i≠ja_{i1}A_{j1}+a_{i2}A_{j2}+\cdots+a_{in}A_{jn}=\left\{\begin{array}{l}\vert A\vert,i=j\\0,i\neq j\end{array}\right.ai1​Aj1​+ai2​Aj2​+⋯+ain​Ajn​={∣A∣,i=j0,i​=j​
或a1iA1j+a2iA2j+⋯+aniAnj={∣A∣,i=j0,i≠ja_{1i}A_{1j}+a_{2i}A_{2j}+\cdots+a_{ni}A_{nj}=\left\{\begin{array}{l}\vert A\vert,i=j\\0,i\neq j\end{array}\right.a1i​A1j​+a2i​A2j​+⋯+ani​Anj​={∣A∣,i=j0,i​=j​
即AA∗=A∗A=∣A∣EAA\ast=A\ast A=\vert A\vert EAA∗=A∗A=∣A∣E,其中:A∗=(A11A12⋯A1nA21A22⋯A2n⋯⋯⋯⋯An1An2⋯Ann)=(Aji)=(Aij)TA\ast=\begin{pmatrix}A_{11}&A_{12}&\cdots&A_{1n}\\A_{21}&A_{22}&\cdots&A_{2n}\\\cdots&\cdots&\cdots&\cdots\\A_{n1}&A_{n2}&\cdots&A_{nn}\end{pmatrix}=(A_{ji})={(A_{ij})}^TA∗=⎝⎜⎜⎛​A11​A21​⋯An1​​A12​A22​⋯An2​​⋯⋯⋯⋯​A1n​A2n​⋯Ann​​⎠⎟⎟⎞​=(Aji​)=(Aij​)T
Dn=∣11⋯1x1x2⋯xn⋯⋯⋯⋯x1n−1x2n−1⋯xnn−1∣=∏1≤j≤i≤n(xi−xj)D_n=\begin{vmatrix}1&1&\cdots&1\\x_1&x_2&\cdots&x_n\\\cdots&\cdots&\cdots&\cdots\\x_1^{n-1}&x_2^{n-1}&\cdots&x_n^{n-1}\end{vmatrix}={\textstyle\prod_{1\leq j\leq i\leq n}}(x_i-x_j)Dn​=∣∣∣∣∣∣∣∣​1x1​⋯x1n−1​​1x2​⋯x2n−1​​⋯⋯⋯⋯​1xn​⋯xnn−1​​∣∣∣∣∣∣∣∣​=∏1≤j≤i≤n​(xi​−xj​)
(2)设A,BA,BA,B为nnn阶方阵,则∣AB∣=∣A∣∣B∣=∣B∣∣A∣|AB|=|A||B|=|B||A|∣AB∣=∣A∣∣B∣=∣B∣∣A∣,但∣A±B∣=∣A∣±∣B∣|A±B|=|A|±|B|∣A±B∣=∣A∣±∣B∣不一定成立。
(3)∣kA∣=kn∣A∣|kA|=k^n|A|∣kA∣=kn∣A∣,AAA为nnn阶方阵。
(4)设AAA为nnn阶方阵,∣AT∣=∣A∣;∣A−1∣=∣A∣−1\vert A^T\vert=\vert A\vert;\vert A^{-1}\vert=\vert A\vert^{-1}∣AT∣=∣A∣;∣A−1∣=∣A∣−1(若AAA可逆),∣A∗∣=∣A∣n−1n≥2\vert A^\ast\vert=\vert A\vert^{n-1}\;\;n\geq2∣A∗∣=∣A∣n−1n≥2
(5)∣AOOB∣=∣ACOB∣=∣AOCB∣=∣A∣∣B∣\begin{vmatrix}A&O\\O&B\end{vmatrix}=\begin{vmatrix}A&C\\O&B\end{vmatrix}=\begin{vmatrix}A&O\\C&B\end{vmatrix}=\vert A\vert\vert B\vert∣∣∣∣​AO​OB​∣∣∣∣​=∣∣∣∣​AO​CB​∣∣∣∣​=∣∣∣∣​AC​OB​∣∣∣∣​=∣A∣∣B∣,A,BA,BA,B为方阵,但∣OAm×mBn×nO∣=(−1)mn⋅∣A∣∣B∣\begin{vmatrix}O&A_{m\times m}\\B_{n\times n}&O\end{vmatrix}={(-1)}^{mn}\cdot\vert A\vert\vert B\vert∣∣∣∣​OBn×n​​Am×m​O​∣∣∣∣​=(−1)mn⋅∣A∣∣B∣。
(6)范德蒙行列式Dn=∣11⋯1x1x2⋯xn⋯⋯⋯⋯x1n−1x2n−1⋯xnn−1∣=∏1≤j≤i≤n(xi−xj)D_n=\begin{vmatrix}1&1&\cdots&1\\x_1&x_2&\cdots&x_n\\\cdots&\cdots&\cdots&\cdots\\x_1^{n-1}&x_2^{n-1}&\cdots&x_n^{n-1}\end{vmatrix}={\textstyle\prod_{1\leq j\leq i\leq n}}(x_i-x_j)Dn​=∣∣∣∣∣∣∣∣​1x1​⋯x1n−1​​1x2​⋯x2n−1​​⋯⋯⋯⋯​1xn​⋯xnn−1​​∣∣∣∣∣∣∣∣​=∏1≤j≤i≤n​(xi​−xj​)
设AAA是nnn阶方阵,λi(i=1,2,⋯n)\lambda_i(i=1,2,\cdots n)λi​(i=1,2,⋯n)是AAA的nnn个特征值,则∣A∣=∏i=1nλi\vert A\vert={\textstyle\prod_{i=1}^n}\lambda_i∣A∣=∏i=1n​λi​。

矩阵

矩阵:m×nm\times nm×n个数aija_{ij}aij​排成mmm行nnn列的表格[a11a12⋯a1na21a22…a2n⋮⋮⋱⋮am1am2⋯amn]\begin{bmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\dots&a_{2n}\\\vdots&\vdots&\ddots&\vdots\\a_{m1}&a_{m2}&\cdots&a_{mn}\end{bmatrix}⎣⎢⎢⎢⎡​a11​a21​⋮am1​​a12​a22​⋮am2​​⋯…⋱⋯​a1n​a2n​⋮amn​​⎦⎥⎥⎥⎤​称为矩阵,简记为AAA或者(aij)m×n{(a_{ij})}_{m\times n}(aij​)m×n​。若m=nm=nm=n,则称AAA是nnn阶矩阵或nnn阶方阵。

矩阵的线性运算

1、矩阵的加法

设A=(aij),B=(bij)A=(a_{ij}),B=(b_{ij})A=(aij​),B=(bij​)是两个m×nm\times nm×n矩阵,则m×nm\times nm×n矩阵C=(cij)=aij+bijC=(c_{ij})=a_{ij}+b_{ij}C=(cij​)=aij​+bij​称为矩阵AAA和BBB的核,记为A+B=CA+B=CA+B=C。

2、矩阵的数乘

设A=(aij)A=(a_{ij})A=(aij​)是m×nm\times nm×n矩阵,kkk是一个常数,则m×nm\times nm×n矩阵(kaij)(ka_{ij})(kaij​)称为数kkk与矩阵AAA的数乘,记为kAkAkA。

3、矩阵的乘法

设A=(aij)A=(a_{ij})A=(aij​)是m×nm\times nm×n矩阵,设B=(bij)B=(b_{ij})B=(bij​)是n×sn\times sn×s矩阵,那么m×sm\times sm×s矩阵C=(cij)C=(c_{ij})C=(cij​),其中cij=ai1b1j+ai2b2j+⋯+ainbnj=∑k=1naikbkjc_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots+a_{in}b_{nj}={\textstyle\sum_{k=1}^n}a_{ik}b_{kj}cij​=ai1​b1j​+ai2​b2j​+⋯+ain​bnj​=∑k=1n​aik​bkj​称为ABABAB的乘积,记为C=ABC=ABC=AB。

4、AT,A−1,A∗A^T,A^{-1},A^\astAT,A−1,A∗三者之间的关系

(1)(AT)T=A,(AB)T=BTAT,(kA)T=kAT,(A±B)T=AT±BT{(A^T)}^T=A,{(AB)}^T=B^TA^T,{(kA)}^T=kA^T,{(A\pm B)}^T=A^T\pm B^T(AT)T=A,(AB)T=BTAT,(kA)T=kAT,(A±B)T=AT±BT
(2)(A−1)−1=A,(AB)−1=B−1A−1,(kA)−1=1kA−1{(A^{-1})}^{-1}=A,{(AB)}^{-1}=B^{-1}A^{-1},{(kA)}^{-1}=\frac1kA^{-1}(A−1)−1=A,(AB)−1=B−1A−1,(kA)−1=k1​A−1,但(A±B)−1=A−1±B−1{(A\pm B)}^{-1}=A^{-1}\pm B^{-1}(A±B)−1=A−1±B−1不一定成立。
(3)(A∗)∗=∣A∣n−2A(n≥3),(AB)∗=B∗A∗,(kA)∗=kn−1A∗(n≥2){(A^\ast)}^\ast=\vert A\vert^{n-2}A(n\geq3),{(AB)}^\ast=B^\ast A^\ast,{(kA)}^\ast=k^{n-1}A^\ast(n\geq2)(A∗)∗=∣A∣n−2A(n≥3),(AB)∗=B∗A∗,(kA)∗=kn−1A∗(n≥2),但(A±B)∗=A∗±B∗{(A\pm B)}^{*}=A^{*}\pm B^{*}(A±B)∗=A∗±B∗不一定成立。
(4)(A−1)T=(AT)−1,(A−1)∗=(AA∗)−1,(A∗)T=(AT)∗{(A^{-1})}^T={(A^T)}^{-1},{(A^{-1})}^\ast={(AA^\ast)}^{-1}{,(A^\ast)}^T={(A^T)}^\ast(A−1)T=(AT)−1,(A−1)∗=(AA∗)−1,(A∗)T=(AT)∗。

5、有关A∗A^\astA∗的结论

(1)AA∗=A∗A=∣A∣EAA^\ast=A^\ast A=\vert A\vert EAA∗=A∗A=∣A∣E
(2)∣A∗∣=∣A∣n−1(n≥2),(kA)∗=kn−1A∗,(A∗)∗=∣A∣n−2A(n≥3)\vert A^\ast\vert=\vert A\vert^{n-1}(n\geq2),{(kA)}^\ast=k^{n-1}A^\ast,{(A^\ast)}^\ast=\vert A\vert^{n-2}A(n\geq3)∣A∗∣=∣A∣n−1(n≥2),(kA)∗=kn−1A∗,(A∗)∗=∣A∣n−2A(n≥3)
(3)若AAA可逆,则A∗=∣A∣A−1,(A∗)∗=1∣A∣AA^\ast=\vert A\vert A^{-1},{(A^\ast)}^\ast=\frac1{\vert A\vert}AA∗=∣A∣A−1,(A∗)∗=∣A∣1​A
(4)若AAA为nnn阶方阵,则r(A∗)={n,r(A)=n1,r(A)=n−10,r(A)<n−1r(A^\ast)=\left\{\begin{array}{l}\;n,r(A)=n\\\begin{array}{c}1,r(A)=n-1\\0,r(A)<n-1\end{array}\end{array}\right.r(A∗)=⎩⎨⎧​n,r(A)=n1,r(A)=n−10,r(A)<n−1​​
(4)(A−1)T=(AT)−1,(A−1)∗=(AA∗)−1,(A∗)T=(AT)∗{(A^{-1})}^T={(A^T)}^{-1},{(A^{-1})}^\ast={(AA^\ast)}^{-1}{,(A^\ast)}^T={(A^T)}^\ast(A−1)T=(AT)−1,(A−1)∗=(AA∗)−1,(A∗)T=(AT)∗。

6、有关A−1A^{-1}A−1的结论

AAA可逆⇔AA−1=E;⇔∣A∣≠0;⇔r(A)=n\Leftrightarrow AA^{-1}=E;\Leftrightarrow\vert A\vert\neq0;\Leftrightarrow r(A)=n⇔AA−1=E;⇔∣A∣​=0;⇔r(A)=n;
⇔A\Leftrightarrow A⇔A可以表示为初等矩阵的乘积;⇔A\Leftrightarrow A⇔A无零特征值;⇔Ax=0\Leftrightarrow Ax=0⇔Ax=0只有零解。

7、有关矩阵秩的结论

(1)秩r(A)r(A)r(A)=行秩=列秩;
(2)r(Am×n)≤min(m,n)r(A_{m\times n})\leq min(m,n)r(Am×n​)≤min(m,n);
(3)A≠0⇒r(A)≥1A\neq0\Rightarrow r(A)\geq1A​=0⇒r(A)≥1;
(4)r(A±B)≤r(A)+r(B)r(A\pm B)\leq r(A)+r(B)r(A±B)≤r(A)+r(B);
(5)初等变换不改变矩阵的秩
(6)r(A)+r(B)−n≤r(AB)≤min(r(A),r(B))r(A)+r(B)-n\leq r(AB)\leq min(r(A),r(B))r(A)+r(B)−n≤r(AB)≤min(r(A),r(B)),特别若AB=OAB=OAB=O则:r(A)+r(B)≤nr(A)+r(B)\leq nr(A)+r(B)≤n
(7)若A−1A^{-1}A−1存在⇒r(AB)=r(B)\Rightarrow r(AB)=r(B)⇒r(AB)=r(B);若B−1B^{-1}B−1存在⇒r(AB)=r(A)\Rightarrow r(AB)=r(A)⇒r(AB)=r(A);
r(Am×n)=n⇒r(AB)=r(B)r(A_{m\times n})=n\Rightarrow r(AB)=r(B)r(Am×n​)=n⇒r(AB)=r(B);r(Am×s)=n⇒r(AB)=r(A)r(A_{m\times s})=n\Rightarrow r(AB)=r(A)r(Am×s​)=n⇒r(AB)=r(A);
(8)r(Am×s)=n⇔Ax=0r(A_{m\times s})=n\Leftrightarrow Ax=0r(Am×s​)=n⇔Ax=0只有零解。

8、分块求逆公式

(AOOB)−1=(A−1OOB−1);(ACOB)−1=(A−1−A−1CB−1OB−1);(AOCB)−1=(A−1O−B−1CA−1B−1);(OABO)−1=(OB−1A−1O);\begin{pmatrix}A&O\\O&B\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}&O\\O&B^{-1}\end{pmatrix};\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\begin{pmatrix}A&C\\O&B\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}&-A^{-1}CB^{-1}\\O&B^{-1}\end{pmatrix};\\\;\begin{pmatrix}A&O\\C&B\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}&O\\-B^{-1}CA^{-1}&B^{-1}\end{pmatrix};\;\;\;\;\;\;\;\begin{pmatrix}O&A\\B&O\end{pmatrix}^{-1}=\begin{pmatrix}O&B^{-1}\\A^{-1}&O\end{pmatrix};\;\;(AO​OB​)−1=(A−1O​OB−1​);(AO​CB​)−1=(A−1O​−A−1CB−1B−1​);(AC​OB​)−1=(A−1−B−1CA−1​OB−1​);(OB​AO​)−1=(OA−1​B−1O​);
这里A,BA,BA,B均为可逆方阵。

向量

1、有关向量组的线性表示

(1)α1,α2,⋯αs\alpha_1,\alpha_2,\cdots\alpha_sα1​,α2​,⋯αs​线性相关⇔\Leftrightarrow⇔至少有一个向量可以用其余向量线性表示;
(2)α1,α2,⋯αs\alpha_1,\alpha_2,\cdots\alpha_sα1​,α2​,⋯αs​线性无关,α1,α2,⋯αs,β\alpha_1,\alpha_2,\cdots\alpha_s,\betaα1​,α2​,⋯αs​,β线性相关⇔β\Leftrightarrow\beta⇔β可以由α1,α2,⋯αs\alpha_1,\alpha_2,\cdots\alpha_sα1​,α2​,⋯αs​唯一线性表示。
(3)β\betaβ可以由α1,α2,⋯αs\alpha_1,\alpha_2,\cdots\alpha_sα1​,α2​,⋯αs​线性表示⇔r(α1,α2,⋯αs)=r(α1,α2,⋯αs,β)\Leftrightarrow r(\alpha_1,\alpha_2,\cdots\alpha_s)=r(\alpha_1,\alpha_2,\cdots\alpha_s,\beta)⇔r(α1​,α2​,⋯αs​)=r(α1​,α2​,⋯αs​,β)。

2、有关向量组的线性相关性

(1)部分相关,整体相关;整体无关,部分无关;
(2)a.nnn个nnn维向量α1,α2,⋯αn\alpha_1,\alpha_2,\cdots\alpha_nα1​,α2​,⋯αn​线性无关⇔∣[α1,α2,⋯αn]∣≠0\Leftrightarrow\vert\lbrack\alpha_1,\alpha_2,\cdots\alpha_n\rbrack\vert\neq0⇔∣[α1​,α2​,⋯αn​]∣​=0,nnn个nnn维向量α1,α2,⋯αn\alpha_1,\alpha_2,\cdots\alpha_nα1​,α2​,⋯αn​线性相关⇔∣[α1,α2,⋯αn]∣=0\Leftrightarrow\vert\lbrack\alpha_1,\alpha_2,\cdots\alpha_n\rbrack\vert=0⇔∣[α1​,α2​,⋯αn​]∣=0;
b.n+1n+1n+1个nnn维向量线性相关;
c.若α1,α2,⋯αs\alpha_1,\alpha_2,\cdots\alpha_sα1​,α2​,⋯αs​线性无关,则添加分量后仍线性无关;或一组向量线性相关,去掉某些分量后仍线性相关。

3、向量组的秩与矩阵的秩之间的关系

设r(Am×n)=rr(A_{m\times n})=rr(Am×n​)=r,则AAA的秩r(A)r(A)r(A)与AAA的行列向量组的线性相关性关系为:
(1)若r(Am×n)=r=mr(A_{m\times n})=r=mr(Am×n​)=r=m,则AAA的行向量组线性无关;
(2)若r(Am×n)=r<mr(A_{m\times n})=r<mr(Am×n​)=r<m,则AAA的行向量组线性相关;
(3)若r(Am×n)=r=nr(A_{m\times n})=r=nr(Am×n​)=r=n,则AAA的列向量组线性无关;
(4)若r(Am×n)=r<nr(A_{m\times n})=r<nr(Am×n​)=r<n,则AAA的列向量组线性相关;

4、nnn维向量空间的基变换公式及过渡矩阵

若α1,α2,⋯αn\alpha_1,\alpha_2,\cdots\alpha_nα1​,α2​,⋯αn​与β1,β2,⋯βn\beta_1,\beta_2,\cdots\beta_nβ1​,β2​,⋯βn​是向量空间VVV的两组基,则基变换公式为:
(β1,β2,⋯βn)=(α1,α2,⋯αn)[c11c12⋯c1nc21c22⋯c2n⋮⋮⋱⋮cn1cn2⋯cnn]=(α1,α2,⋯αn)C(\beta_1,\beta_2,\cdots\beta_n)=(\alpha_1,\alpha_2,\cdots\alpha_n)\begin{bmatrix}c_{11}&c_{12}&\cdots&c_{1n}\\c_{21}&c_{22}&\cdots&c_{2n}\\\vdots&\vdots&\ddots&\vdots\\c_{n1}&c_{n2}&\cdots&c_{nn}\end{bmatrix}=(\alpha_1,\alpha_2,\cdots\alpha_n)C(β1​,β2​,⋯βn​)=(α1​,α2​,⋯αn​)⎣⎢⎢⎢⎡​c11​c21​⋮cn1​​c12​c22​⋮cn2​​⋯⋯⋱⋯​c1n​c2n​⋮cnn​​⎦⎥⎥⎥⎤​=(α1​,α2​,⋯αn​)C
其中CCC是可逆矩阵,称为由基α1,α2,⋯αn\alpha_1,\alpha_2,\cdots\alpha_nα1​,α2​,⋯αn​到基β1,β2,⋯βn\beta_1,\beta_2,\cdots\beta_nβ1​,β2​,⋯βn​的过渡矩阵。

5、坐标变换公式

若向量γ\gammaγ在基α1,α2,⋯αn\alpha_1,\alpha_2,\cdots\alpha_nα1​,α2​,⋯αn​与基β1,β2,⋯βn\beta_1,\beta_2,\cdots\beta_nβ1​,β2​,⋯βn​的坐标分别是X=(x1,x2,⋯xn)T,Y=(y1,y2,⋯yn)TX={(x_1,x_2,\cdots x_n)}^T,Y={(y_1,y_2,\cdots y_n)}^TX=(x1​,x2​,⋯xn​)T,Y=(y1​,y2​,⋯yn​)T,即γ=x1α1+x2α2+⋯+xnαn=y1β1+y2β2+⋯+ynβn\gamma=x_1\alpha_1+x_2\alpha_2+\cdots+x_n\alpha_n={y_1\beta_1+y_2\beta_2+\cdots+y_n\beta_n}γ=x1​α1​+x2​α2​+⋯+xn​αn​=y1​β1​+y2​β2​+⋯+yn​βn​,则向量坐标变换公式为X=CYX=CYX=CY或Y=C−1XY=C^{-1}XY=C−1X,其中CCC是从基α1,α2,⋯αn\alpha_1,\alpha_2,\cdots\alpha_nα1​,α2​,⋯αn​到基β1,β2,⋯βn\beta_1,\beta_2,\cdots\beta_nβ1​,β2​,⋯βn​的过渡矩阵。

6、向量的内积

(α,β)=a1b1+a2b2+⋯+anbn=αTβ=βTα(\alpha,\beta)=a_1b_1+a_2b_2+\cdots+a_nb_n=\alpha^T\beta=\beta^T\alpha(α,β)=a1​b1​+a2​b2​+⋯+an​bn​=αTβ=βTα

7、Schmidt正交化

若α1,α2,⋯αs\alpha_1,\alpha_2,\cdots\alpha_sα1​,α2​,⋯αs​线性无关,则可构造β1,β2,⋯βs\beta_1,\beta_2,\cdots\beta_sβ1​,β2​,⋯βs​使其两两正交,且βi\beta_iβi​仅是α1,α2,⋯αi\alpha_1,\alpha_2,\cdots\alpha_iα1​,α2​,⋯αi​的线性组合(i=1,2,⋯,n)(i=1,2,\cdots,n)(i=1,2,⋯,n),再把βi\beta_iβi​单位化,记γi=βi∣βi∣\gamma_i=\frac{\beta_i}{\vert\beta_i\vert}γi​=∣βi​∣βi​​,则γ1,γ2,⋯γi\gamma_1,\gamma_2,\cdots\gamma_iγ1​,γ2​,⋯γi​是规范化正交向量组。其中β1=α1,β2=α2−(α2,β1)(β1,β1)β1,β3=α3−(α3,β1)(β1,β1)β1−(α3,β2)(β2,β2)β2,⋯⋯βs=αs−(αs,β1)(β1,β1)β1−(αs,β2)(β2,β2)β2−⋯−(αs,βs−1)(βs−1,βs−1)βs−1\beta_1=\alpha_1,\beta_2=\alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1,\beta_3=\alpha_3-\frac{(\alpha_3,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\frac{(\alpha_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2,\cdots\cdots\\\beta_s=\alpha_s-\frac{(\alpha_s,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\frac{(\alpha_s,\beta_2)}{(\beta_2,\beta_2)}\beta_2-\cdots-\frac{(\alpha_s,\beta_{s-1})}{(\beta_{{}_{s-1}},\beta_{s-1})}\beta_{{}_{s-1}}β1​=α1​,β2​=α2​−(β1​,β1​)(α2​,β1​)​β1​,β3​=α3​−(β1​,β1​)(α3​,β1​)​β1​−(β2​,β2​)(α3​,β2​)​β2​,⋯⋯βs​=αs​−(β1​,β1​)(αs​,β1​)​β1​−(β2​,β2​)(αs​,β2​)​β2​−⋯−(βs−1​​,βs−1​)(αs​,βs−1​)​βs−1​​

8、正交基及规范正交基

向量空间一组基中的向量如果两两正交,就称为正交基;若正交基中每个向量都是单位向量,就称其为规范正交基。

线性方程组

1、克莱姆法则

线性方程组{a11x1+a12x2+⋯a1nxn=b1a21x1+a22x2+⋯a2nxn=b2⋯⋯⋯⋯⋯⋯an1x1+an2x2+⋯annxn=bn\left\{\begin{array}{l}\begin{array}{c}a_{11}x_1+a_{12}x_2+\cdots a_{1n}x_n=b_1\\a_{21}x_1+a_{22}x_2+\cdots a_{2n}x_n=b_2\end{array}\\\begin{array}{c}\cdots\cdots\cdots\cdots\cdots\cdots\\a_{n1}x_1+a_{n2}x_2+\cdots a_{nn}x_n=b_n\end{array}\end{array}\right.⎩⎪⎪⎨⎪⎪⎧​a11​x1​+a12​x2​+⋯a1n​xn​=b1​a21​x1​+a22​x2​+⋯a2n​xn​=b2​​⋯⋯⋯⋯⋯⋯an1​x1​+an2​x2​+⋯ann​xn​=bn​​​,如果系数行列式D=∣A∣≠0D=\vert A\vert\neq0D=∣A∣​=0,则方程组有唯一解,x1=D1D,x2=D2D,⋯,xn=DnDx_1=\frac{D_1}D,x_2=\frac{D_2}D,\cdots,x_n=\frac{D_n}Dx1​=DD1​​,x2​=DD2​​,⋯,xn​=DDn​​,其中DjD_jDj​是把DDD中第jjj列元素换成方程组右端的常数列所得的行列式。

2、Ax=0Ax=0Ax=0解的情况

nnn阶矩阵AAA可逆⇔Ax=0\Leftrightarrow Ax=0⇔Ax=0只有零解⇔∀b,Ax=b\Leftrightarrow\forall b, Ax=b⇔∀b,Ax=b总有唯一解,一般地,r(Am×n)=n⇔Ax=0r(A_{m\times n})=n\Leftrightarrow Ax=0r(Am×n​)=n⇔Ax=0只有零解。

3、非其次性方程组有解的充分必要条件,线性方程组解的性质和解的结构

(1)设AAA为m×nm\times nm×n矩阵,若r(Am×n)=mr(A_{m\times n})=mr(Am×n​)=m,则对Ax=bAx=bAx=b而言必有r(A)=r(A⋮b)=mr(A)=r(A\vdots b)=mr(A)=r(A⋮b)=m,从而Ax=bAx=bAx=b有解。
(2)设x1,x2,⋯xsx_1,x_2,\cdots x_sx1​,x2​,⋯xs​为Ax=bAx=bAx=b的解,则k1x1+k2x2+⋯+ksxsk_1x_1+k_2x_2+\cdots+k_sx_sk1​x1​+k2​x2​+⋯+ks​xs​当k1+k2+⋯+ks=1k_1+k_2+\cdots+k_s=1k1​+k2​+⋯+ks​=1时仍为Ax=bAx=bAx=b的解;但当k1+k2+⋯+ks=0k_1+k_2+\cdots+k_s=0k1​+k2​+⋯+ks​=0时,则为Ax=0Ax=0Ax=0的解。特别x1+x22\frac{x_1+x_2}22x1​+x2​​为Ax=bAx=bAx=b的解;2x3−(x1+x2)2x_3-(x_1+x_2)2x3​−(x1​+x2​)为Ax=0Ax=0Ax=0的解。
(3)非其次性方程组Ax=bAx=bAx=b无解⇔r(A)+1=r(A‾)⇔b\Leftrightarrow r(A)+1=r(\overline A)\Leftrightarrow b⇔r(A)+1=r(A)⇔b不能由AAA的列向量α1,α2,⋯αn\alpha_1,\alpha_2,\cdots\alpha_nα1​,α2​,⋯αn​线性表示。

4、齐次线性方程组的基础解系和通解,解空间,非齐次线性方程组的通解

(1)齐次方程组Ax=0Ax=0Ax=0恒有j解(必有零解)。当有非零解时,由于解向量的任意线性组合仍是该齐次方程组的解向量,因此Ax=0Ax=0Ax=0的全体解向量构成一个向量空间,称为该方程组的解空间,解空间的维数是n−r(A)n-r(A)n−r(A),解空间的一组基称为齐次方程组的基础解系。
(2)η1,η2,⋯ηt\eta_1,\eta_2,\cdots\eta_tη1​,η2​,⋯ηt​是Ax=0Ax=0Ax=0基础解系,即:
1)η1,η2,⋯ηt\eta_1,\eta_2,\cdots\eta_tη1​,η2​,⋯ηt​是Ax=0Ax=0Ax=0的解;
2)η1,η2,⋯ηt\eta_1,\eta_2,\cdots\eta_tη1​,η2​,⋯ηt​线性无关。
3)Ax=0Ax=0Ax=0的任一解都可以由η1,η2,⋯ηt\eta_1,\eta_2,\cdots\eta_tη1​,η2​,⋯ηt​线性表出,k1η1+k2η2+⋯+ktηtk_1\eta_1+k_2\eta_2+\cdots+k_t\eta_tk1​η1​+k2​η2​+⋯+kt​ηt​是Ax=0Ax=0Ax=0的通解,其中k1,k2,⋯+ktk_1,k_2,\cdots+k_tk1​,k2​,⋯+kt​是任意常数。

矩阵的特征值与特征向量

1、矩阵的特征值和特征向量的概念及性质

(1)设λ\lambdaλ是AAA的特征值,则kA,aA+bE,A2,Am,f(A),AT,A−1,A∗kA,aA+bE,A^2,A^m,f(A),A^T,A^{-1},A^\astkA,aA+bE,A2,Am,f(A),AT,A−1,A∗有一个特征值分别为kλ,aλ+b,λ2,λm,f(λ),λ,λ−1,∣A∣λk\lambda,a\lambda+b,\lambda^2,\lambda^m,f(\lambda),\lambda,\lambda^{-1},\frac{\vert A\vert}\lambdakλ,aλ+b,λ2,λm,f(λ),λ,λ−1,λ∣A∣​,且对应应特征向量相同(ATA^TAT例外)。
(2)若λ1,λ2,⋯λn\lambda_1,\lambda_2,\cdots\lambda_nλ1​,λ2​,⋯λn​为AAA的nnn个特征值,则∑i=1nλi=∑i=1naii,∏i=1nλi=∣A∣{\textstyle\sum_{i=1}^n}{\textstyle{\scriptstyle\lambda}_i}{\textstyle=}{\textstyle\sum_{i=1}^n}a_{ii},{\textstyle\prod_{i=1}^n}{\textstyle{\scriptstyle\lambda}_i}{\textstyle=}{\textstyle\vert}{\textstyle A}{\textstyle\vert}∑i=1n​λi​=∑i=1n​aii​,∏i=1n​λi​=∣A∣,从而∣A∣≠0⇔A\textstyle\vert A\vert\neq0\Leftrightarrow A∣A∣​=0⇔A没有特征值。
(3)设λ1,λ2,⋯λs\lambda_1,\lambda_2,\cdots\lambda_sλ1​,λ2​,⋯λs​是AAA的sss个特征值,对应特征向量为α1,α2,⋯αs\textstyle\alpha_1,\alpha_2,\cdots\alpha_sα1​,α2​,⋯αs​,若α=k1α1+k2α2+⋯+ksαs\alpha=\textstyle k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_sα=k1​α1​+k2​α2​+⋯+ks​αs​,则An=k1Anα1+k2Anα2+⋯+ksAnαs=k1λnα1+k2λnα2+⋯+ksλnαs\textstyle A^n=k_1A^n\alpha_1+k_2A^n\alpha_2+\cdots+k_sA^n\alpha_s=k_1\lambda^n\alpha_1+k_2\lambda^n\alpha_2+\cdots+k_s\lambda^n\alpha_sAn=k1​Anα1​+k2​Anα2​+⋯+ks​Anαs​=k1​λnα1​+k2​λnα2​+⋯+ks​λnαs​。

2、相似变换、相似矩阵的概念及性质

(1)若A∼BA\sim BA∼B,则
1)AT∼BT,A−1∼B−1,A∗∼B∗A^T\sim B^T,A^{-1}\sim B^{-1},A^\ast\sim B^\astAT∼BT,A−1∼B−1,A∗∼B∗
2)∣A∣∼∣B∣,∑i=1nAii=∑i=1nbii,r(A)=r(B)\vert A\vert\sim\vert B\vert,{\textstyle\sum_{i=1}^n}A_{ii}={\textstyle\sum_{i=1}^n}b_{ii}{\textstyle,}{\textstyle r}{\textstyle(}{\textstyle A}{\textstyle)}{\textstyle=}{\textstyle r}{\textstyle(}{\textstyle B}{\textstyle)}∣A∣∼∣B∣,∑i=1n​Aii​=∑i=1n​bii​,r(A)=r(B)
3)∣λE−A∣=∣λE−B∣\vert\lambda E-A\vert{\textstyle=}{\textstyle\vert}{\textstyle\lambda}{\textstyle E}{\textstyle-}{\textstyle B}{\textstyle\vert}∣λE−A∣=∣λE−B∣,对∀λ\textstyle\forall\lambda∀λ成立。

3、矩阵可相似对角化的充分必要条件

(1)设AAA为nnn阶方阵,则AAA可对角化⇔\textstyle\Leftrightarrow⇔对每个kik_iki​重根特征值λi\lambda_iλi​,有n−r(λiE−A)=kin-r(\lambda_iE-A)=k_in−r(λi​E−A)=ki​
(2)设AAA可对角化,则由P−1AP=ΛP^{-1}AP=\LambdaP−1AP=Λ,有A=PΛP−1A=P\Lambda P^{-1}A=PΛP−1,从而An=PΛnP−1A^n=P\Lambda^nP^{-1}An=PΛnP−1
(3)重要结论
1)若A∼B,C∼DA\sim B,C\sim DA∼B,C∼D,则[AOOC]∼[BOOD]\begin{bmatrix}A&O\\O&C\end{bmatrix}\sim\begin{bmatrix}B&O\\O&D\end{bmatrix}[AO​OC​]∼[BO​OD​];
2)若A∼B,C∼DA\sim B,C\sim DA∼B,C∼D,则f(A)∼f(B),∣f(A)∼∣f(B)∣f(A)\sim f(B),\vert f(A)\sim\vert f(B)\vertf(A)∼f(B),∣f(A)∼∣f(B)∣,其中f(A)f(A)f(A)为关nnn阶方阵AAA的多项式;
3)若AAA为可对角化矩阵,则其非零特征数的个数(重根重复计算)=秩AAA

4、实对称矩阵的特征值、特征向量及相似对角阵

(1)相似矩阵:设A、BA、BA、B为两个nnn阶方阵,如果存在一个可逆矩阵PPP,使得B=P−1APB=P^{-1}APB=P−1AP成立;
则称矩阵AAA与BBB相似,记为A∼BA\sim BA∼B。
(2)相似矩阵的性质,如果A∼BA\sim BA∼B则有:
1)AT∼BTA^T\sim B^TAT∼BT
2)A−1∼B−1A^{-1}\sim B^{-1}A−1∼B−1(若A、BA、BA、B均可逆
3)Ak∼BkA^k\sim B^kAk∼Bk(k为正整数)
4)∣λE−A∣=∣λE−B∣\vert\lambda E-A\vert{\textstyle=}{\textstyle\vert}{\textstyle\lambda}{\textstyle E}{\textstyle-}{\textstyle B}|∣λE−A∣=∣λE−B∣,从而A、BA、BA、B均有相同的特征值。
5)∣A∣∼∣B∣\vert A\vert\sim\vert B\vert∣A∣∼∣B∣,从而A、BA、BA、B同时可逆或者不可逆
6)秩(A)(A)(A)=秩(B)(B)(B),∣λE−A∣=∣λE−B∣\vert\lambda E-A\vert{\textstyle=}{\textstyle\vert}{\textstyle\lambda}{\textstyle E}{\textstyle-}{\textstyle B}|∣λE−A∣=∣λE−B∣,A、BA、BA、B不一定相似

二次型

1、nnn个变量x1,x2,⋯xnx_1,x_2,\cdots x_nx1​,x2​,⋯xn​的二次齐次函数

f(x1,x2,⋯xn)=∑i=1n∑j=1naijxiyjf(x_1,x_2,\cdots x_n)={\textstyle\sum_{i=1}^n}{\textstyle\sum_{j=1}^n}a_{ij}x_iy_jf(x1​,x2​,⋯xn​)=∑i=1n​∑j=1n​aij​xi​yj​,其中f(x1,x2,⋯xn)=∑i=1n∑j=1naijxiyjaij=aji(i,j=1,2,⋯n)f(x_1,x_2,\cdots x_n)={\textstyle\sum_{i=1}^n}{\textstyle\sum_{j=1}^n}a_{ij}x_iy_j\\a_{ij}=a_{ji}(i,j=1,2,\cdots n)f(x1​,x2​,⋯xn​)=∑i=1n​∑j=1n​aij​xi​yj​aij​=aji​(i,j=1,2,⋯n),称为nnn元二次型,简称二次型。若令x=[x1x2⋮xn],A=[a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮an1an2⋯ann]x=\begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix},A=\begin{bmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&\ddots&\vdots\\a_{n1}&a_{n2}&\cdots&a_{nn}\end{bmatrix}x=⎣⎢⎢⎢⎡​x1​x2​⋮xn​​⎦⎥⎥⎥⎤​,A=⎣⎢⎢⎢⎡​a11​a21​⋮an1​​a12​a22​⋮an2​​⋯⋯⋱⋯​a1n​a2n​⋮ann​​⎦⎥⎥⎥⎤​,则二次型fff可改写成矩阵向量形式f=xTAxf=x^TAxf=xTAx,其中AAA称为二次型矩阵,因为aij=aji(i,j=1,2,⋯n)a_{ij}=a_{ji}(i,j=1,2,\cdots n)aij​=aji​(i,j=1,2,⋯n),所以二次型矩阵均为对称矩阵,且二次型与对称矩阵一一对应,并把矩阵AAA的秩称为二次型的秩。

2、惯性定理,二次型标准形和规范形

(1)惯性定理
对于任一二次型,不论选取怎样的合同变换使它华为仅含平方项的标准型,中负惯性指数与所选变换无关,这就是所谓的惯性定理。
(2)标准形
二次型f=xTAxf=x^TAxf=xTAx经过合同变换x=Cyx=Cyx=Cy转化为f=xTAx=yTCTACf=x^TAx=y^TC^TACf=xTAx=yTCTAC,y=∑i=1ndiyi2y={\textstyle\sum_{i=1}^n}d_iy_i^2y=∑i=1n​di​yi2​称为f(r≤n)f(r≤n)f(r≤n)的标准形。在一般的数域n内,二次型的标准型是不唯一的,与所作的合同变换有关,但系数不为零的平方项的个数由rrr(AAA的秩)唯一确定。
(3)规范形
任一实二次型fff都可经过合同变换化为规范形f=z12+z22+⋯+zp2+zp+12−⋯−zr2f=z_1^2+z_2^2+\cdots+z_p^2+z_{p+1}^2-\cdots-z_r^2f=z12​+z22​+⋯+zp2​+zp+12​−⋯−zr2​,其中rrr为AAA的秩,ppp为正惯性指数,r−pr-pr−p为负惯性指数,且规范型唯一。

3、用正交变换和配方法化二次型为标准形,二次型及其矩阵的正定性

(1)设AAA正定⇒kA(K>0),AT,A−1,A∗\Rightarrow kA(K>0),A^T,A^{-1},A^\ast⇒kA(K>0),AT,A−1,A∗正定;∣A∣>0,A|A|>0,A∣A∣>0,A可逆;aii>0a_{ii}>0aii​>0,且∣Aii∣>0\vert A_{ii}\vert>0∣Aii​∣>0;
(2)A、BA、BA、B正定⇒A+B\Rightarrow A+B⇒A+B正定,但AB,BAAB,BAAB,BA不一定正定;
(3)AAA正定⇔f(x)=xTAx>0,∀x≠0⇔A\Leftrightarrow f(x)=x^TAx>0,\forall x\neq0\Leftrightarrow A⇔f(x)=xTAx>0,∀x​=0⇔A的各阶顺序主子式全大于零⇔A\Leftrightarrow A⇔A的所有特征值大于零⇔A\Leftrightarrow A⇔A的正惯性指数为nnn⇔\Leftrightarrow⇔存在可逆矩阵PPP使A=PTPA=P^TPA=PTP ⇔\Leftrightarrow⇔存在正交矩阵QQQ,使QTAQ=Q−1AQ=(λ1⋱λn)Q^TAQ=Q^{-1}AQ=\begin{pmatrix}\lambda_1&\;&\;\\\;&\ddots&\;\\\;&\;&\lambda_n\end{pmatrix}QTAQ=Q−1AQ=⎝⎛​λ1​​⋱​λn​​⎠⎞​,其中λi>0,i=1,2,⋯n\lambda_i>0,i=1,2,\cdots nλi​>0,i=1,2,⋯n正定⇒kA(k>0),AT,A−1,A∗\Rightarrow kA(k>0),A^T,A^{-1},A^\ast⇒kA(k>0),AT,A−1,A∗正定;∣A∣>0,A|A|>0,A∣A∣>0,A可逆;aii>0a_{ii}>0aii​>0,且∣Aii∣>0\vert A_{ii}\vert>0∣Aii​∣>0;

概率与数理统计

随机事件和概率

1、事件的关系与运算

(1)子事件:A⊂BA\subset BA⊂B,若AAA发生,则BBB发生。
(2)相等事件:A=BA=BA=B,即A⊂BA\subset BA⊂B,且B⊂AB\subset AB⊂A。
(3)和事件:A∩BA\cap BA∩B(或A+BA+BA+B),AAA与BBB中至少有一个发生。
(4)差事件:A−BA-BA−B,AAA发生但BBB不发生。
(5)积事件:A∩BA\cap BA∩B(或ABABAB),AAA与BBB同时发生。
(6)互斥事件(互不相容):A∩B=ϕA\cap B=\phiA∩B=ϕ
(7)互逆事件(对立事件):A∩B=ϕ,A∪B=Ω,A=B‾,B=A‾A\cap B=\phi,A\cup B=\Omega,A=\overline B,B=\overline AA∩B=ϕ,A∪B=Ω,A=B,B=A

2、运算律

(1)交换律:A∪B=B∪A,A∩B=B∩AA\cup B=B\cup A,A\cap B=B\cap AA∪B=B∪A,A∩B=B∩A
(2)结合律:(A∪B)∪C=A∪(B∪C);(A∩B)∩C=A∩(B∩C)(A\cup B)\cup C=A\cup(B\cup C);(A\cap B)\cap C=A\cap(B\cap C)(A∪B)∪C=A∪(B∪C);(A∩B)∩C=A∩(B∩C)
(3)分配率:(A∪B)∩C=(A∩C)∪(B∩C)(A\cup B)\cap C=(A\cap C)\cup(B\cap C)(A∪B)∩C=(A∩C)∪(B∩C)

3、德.摩根律

A∪B‾=A‾∩B‾A∩B‾=A‾∪B‾\overline{A\cup B}=\overline A\cap\overline B\;\;\;\;\overline{A\cap B}=\overline A\cup\overline BA∪B=A∩BA∩B=A∪B

4、完全事件组

A1,A2,⋯AnA_1,A_2,\cdots A_nA1​,A2​,⋯An​两两互斥,且和事件为必然事件,即Ai∩Aj=ϕ,i≠j,∪i=1n=ΩA_i\cap A_j=\phi,i\neq j,\overset n{\underset{i=1}\cup}=\OmegaAi​∩Aj​=ϕ,i​=j,i=1∪​n​=Ω

5、概率的基本概念

(1)概率:事件发生的可能性大小的度量,其严格定义如下:
概率P(g)P(g)P(g)为定义在事件集合上的满足下面3个条件的函数:
1)对任何事件A,P(A)>0A,P(A)>0A,P(A)>0
2)对必然事件Ω,P(Ω)=1\Omega, P(\Omega)=1Ω,P(Ω)=1
3)对A1,A2,⋯AnA_1,A_2,\cdots A_nA1​,A2​,⋯An​,若Ai∩Aj=ϕ(i≠j)A_i\cap A_j=\phi(i\neq j)Ai​∩Aj​=ϕ(i​=j),则P(∪i=1∞Ai)=∑i=1∞P(A)P(\overset\infty{\underset{i=1}\cup}A_i)={\textstyle\sum_{i=1}^\infty}P(A)P(i=1∪​∞​Ai​)=∑i=1∞​P(A)
(2)概率的基本性质
1)P(A‾)=1−P(A)P(\overline A)=1-P(A)P(A)=1−P(A)
2)P(A−B)=P(A)−P(AB)P(A-B)=P(A)-P(AB)P(A−B)=P(A)−P(AB)
3)P(A∪B)=P(A)+P(B)−P(AB)P(A\cup B)=P(A)+P(B)-P(AB)P(A∪B)=P(A)+P(B)−P(AB),特别,当B⊂AB\subset AB⊂A时,P(A−B)=P(A)−P(B)P(A-B)=P(A)-P(B)P(A−B)=P(A)−P(B)且P(B)⩽P(A);P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(BC)−P(AC)+P(ABC)P(B)\leqslant P(A);P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(AC)+P(ABC)P(B)⩽P(A);P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(BC)−P(AC)+P(ABC)
4)若A1,A2,⋯AnA_1,A_2,\cdots A_nA1​,A2​,⋯An​两两互斥,则P(∪i=1nAi)=∑i=1nP(Ai)P(\overset n{\underset{i=1}\cup}A_i)={\textstyle\sum_{i=1}^n}P(A_i)P(i=1∪​n​Ai​)=∑i=1n​P(Ai​)
(3)古典型概率:实验的所有结果只有连个,且每个结果发生的可能性相同,其概率计算公式:
P(A)=事件A发生的基本事件数基本事件总数P(A)=\frac{\mathrm{事件}A\mathrm{发生的基本事件数}}{\mathrm{基本事件总数}}P(A)=基本事件总数事件A发生的基本事件数​
(4)几何型概率:样本空间Ω\OmegaΩ为欧式空间中的一个区域,且每个样本点的出现具有相等可能性,其概率计算公式:
P(A)=A的度量(长度,体积,面积)Ω的度量(长度,体积,面积)P(A)=\frac{A\mathrm{的度量}(\mathrm{长度},\mathrm{体积},\mathrm{面积})}{\Omega\mathrm{的度量}(\mathrm{长度},\mathrm{体积},\mathrm{面积})}P(A)=Ω的度量(长度,体积,面积)A的度量(长度,体积,面积)​

6、概率的基本公式

(1)条件概率:P(B∣A)=P(AB)P(A)P(B\vert A)=\frac{P(AB)}{P(A)}P(B∣A)=P(A)P(AB)​,表示AAA发生的概率下,BBB发生的概率
(2)全概率公式:P(A)=∑i=1nP(A∣Bi)P(Bi),BiBj=∅,i≠j,⋃i=1nBi=Ω.P(A)={\textstyle\sum_{i=1}^n}P(A\vert B_i)P(B_i),B_iB_j=\varnothing,i\neq j,\bigcup_{i=1}^nB_i=\Omega.P(A)=∑i=1n​P(A∣Bi​)P(Bi​),Bi​Bj​=∅,i​=j,⋃i=1n​Bi​=Ω.
(3)贝叶斯公式:P(Bj∣A)=P(A∣Bj)P(Bj)∑i=1nP(A∣Bi)P(Bi),j=1,2⋯nP(B_j\vert A)=\frac{P(A\vert B_j)P(B_j)}{\sum_{i=1}^nP(A\vert B_i)P(B_i)},j=1,2\cdots nP(Bj​∣A)=∑i=1n​P(A∣Bi​)P(Bi​)P(A∣Bj​)P(Bj​)​,j=1,2⋯n
注:上述公式中事件BiB_iBi​的个数可为可列个。
(4)乘法公式:P(A1A2)=P(A1)P(A2∣A1)=P(A2)P(A1∣A2)P(A_1A_2)=P(A_1)P(A_2\vert A_1)=P(A_2)P(A_1\vert A_2)P(A1​A2​)=P(A1​)P(A2​∣A1​)=P(A2​)P(A1​∣A2​)P(A1A2⋯An)=P(A1)P(A2∣A1)P(A3∣A1A2)⋯P(An)P(A1A2⋯An−1)P(A_1A_2\cdots A_n)=P(A_1)P(A_2\vert A_1)P(A_3\vert A_1A_2)\cdots P(A_n)P(A_1A_2\cdots A_{n-1})P(A1​A2​⋯An​)=P(A1​)P(A2​∣A1​)P(A3​∣A1​A2​)⋯P(An​)P(A1​A2​⋯An−1​)

7、事件的独立性

(1)AAA与BBB相互独立⇔P(AB)=P(A)P(B)\Leftrightarrow P(AB)=P(A)P(B)⇔P(AB)=P(A)P(B)
(2)A,B,CA,B,CA,B,C两两独立⇔P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C)\Leftrightarrow P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C)⇔P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C)
(3)A,B,CA,B,CA,B,C相互独立⇔P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C);P(ABC)=P(A)P(B)P(C)\Leftrightarrow P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C);P(ABC)=P(A)P(B)P(C)⇔P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C);P(ABC)=P(A)P(B)P(C)

8、独立重复试验

将某实验独立重复nnn次,若每次实验中事件AAA发生的概率为ppp,则nnn次实验中AAA发生kkk次的概率为:P(X=k)=Cnkpk(1−p)n−kP(X=k)=C_n^kp^k{(1-p)}^{n-k}P(X=k)=Cnk​pk(1−p)n−k

9、重要公式与结论

(1)P(A‾)=1−P(A)P(\overline A)=1-P(A)P(A)=1−P(A)
(2)P(A∪B)=P(A)+P(B)−P(AB)P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(BC)−P(AC)+P(ABC)P(A\cup B)=P(A)+P(B)-P(AB)\\P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(AC)+P(ABC)P(A∪B)=P(A)+P(B)−P(AB)P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(BC)−P(AC)+P(ABC)
(3)P(A−B)=P(A)−P(AB)P(A-B)=P(A)-P(AB)P(A−B)=P(A)−P(AB)
(4)P(AB‾)=1−P(AB),P(A)=P(AB)+P(AB‾),P(A∪B)=P(A)+P(A‾B)=P(AB)+P(AB‾)+P(A‾B)P(A\overline B)=1-P(AB),P(A)=P(AB)+P(A\overline B),P(A\cup B)=P(A)+P(\overline AB)=P(AB)+P(A\overline B)+P(\overline AB)P(AB)=1−P(AB),P(A)=P(AB)+P(AB),P(A∪B)=P(A)+P(AB)=P(AB)+P(AB)+P(AB)
(5)条件概率P(⋅∣B)P(\cdot |B)P(⋅∣B)满足概率的所有性质。例如:
P(A1‾∣B)=1−P(A1∣B)P(A1∪A2∣B)=P(A1∣B)+P(A2∣B)−P(A1A2∣B)P(A1A2∣B)=P(A1∣B)P(A2∣A1B)P(\overline{A_1}\vert B)=1-P(A_1\vert B)\\P(A_1\cup A_2\vert B)=P(A_1\vert B)+P(A_2\vert B)-P(A_1A_2\vert B)\\P(A_1A_2\vert B)=P(A_1\vert B)P(A_2\vert A_1B)P(A1​​∣B)=1−P(A1​∣B)P(A1​∪A2​∣B)=P(A1​∣B)+P(A2​∣B)−P(A1​A2​∣B)P(A1​A2​∣B)=P(A1​∣B)P(A2​∣A1​B)
(6)若A1,A2,⋯AnA_1,A_2,\cdots A_nA1​,A2​,⋯An​相互独立,则Ai∩Aj=ϕ(i≠j)A_i\cap A_j=\phi(i\neq j)Ai​∩Aj​=ϕ(i​=j),则P(∩i=1nAi)=∏i=1nP(Ai),P(∪i=1nAi)=∏i=1n(1−P(Ai))P(\cap_{i=1}^nA_i)={\textstyle\prod_{i=1}^n}P(A_i),P(\cup_{i=1}^nA_i)={\textstyle\prod_{i=1}^n(1-}P(A_i))P(∩i=1n​Ai​)=∏i=1n​P(Ai​),P(∪i=1n​Ai​)=∏i=1n​(1−P(Ai​))
(7)互斥、互逆与独立性之间的关系:AAA与BBB互逆⇒A\Rightarrow A⇒A与BBB互斥,但反之不成立,AAA与BBB互斥(或互逆)且均非零概况事件⇒A\Rightarrow A⇒A与BBB不独立。
(8)若A1,A2,⋯An,B1,B2,⋯BnA_1,A_2,\cdots A_n,B_1,B_2,\cdots B_nA1​,A2​,⋯An​,B1​,B2​,⋯Bn​相互独立,则f(A1,A2,⋯An)f(A_1,A_2,\cdots A_n)f(A1​,A2​,⋯An​)与g(B1,B2,⋯Bn)g(B_1,B_2,\cdots B_n)g(B1​,B2​,⋯Bn​)也相互独立,其中f(⋅)f(\cdot )f(⋅),g(⋅)g(\cdot )g(⋅)分别表示对相应事件做任一事件运算后所得的时间,另外,概率为1(或0)的时间与任何事件相互独立。

随机变量及其概率分布

1、随机变量及概率分布

取值带有随机性的变量,严格地u哦是定义在样本空间个,取值于实数的函数称为随机变量,概率分布通常指分布函数或分布律。

2、分布函数的概念与性质

定义:F(x)=P(X⩽x),−∞<x<+∞F(x)=P(X\leqslant x),-\infty<x<+\inftyF(x)=P(X⩽x),−∞<x<+∞
性质:(1)0⩽F(x)⩽10\leqslant F(x)\leqslant1\;\;\;\;\;\;\;0⩽F(x)⩽1 (2)F(x)F(x)F(x)单调不减
(3)右连续F(x+0)=F(x)F(x+0)=F(x)\;\;F(x+0)=F(x)(3)F(−∞)=0,F(+∞)=1F(-\infty)=0,F(+\infty)=1F(−∞)=0,F(+∞)=1

3、离散型随机概率变量的概率分布

P(X=xi)=pi,i=1,2,⋯n,⋯pi⩾0,∑i=1npi=1P(X=x_i)=p_i,i=1,2,\cdots n,\cdots\;\;\;\;\;\;p_i\geqslant0,{\textstyle\sum_{i=1}^n}p_i=1P(X=xi​)=pi​,i=1,2,⋯n,⋯pi​⩾0,∑i=1n​pi​=1

4、连续型随机概率变量的概率分布

概率密度f(x)f(x)f(x),且:(1)f(x)⩾0f(x)\geqslant0f(x)⩾0,(2)∫−∞+∞f(x)d⁡x⩾1\int_{-\infty}^{+\infty}f(x)\operatorname dx\geqslant1∫−∞+∞​f(x)dx⩾1,(3)xxx为f(x)f(x)f(x)的连续点,则f(x)=F’(x)分布函数F(x)=∫−∞xf(t)d⁡tF(x)=\int_{-\infty}^xf(t)\operatorname dtF(x)=∫−∞x​f(t)dt

5、常见分布

(1)0-1分布:P(X=k)=pk(1−p)k,k=0,1P(X=k)=p^k{(1-p)}^k,k=0,1P(X=k)=pk(1−p)k,k=0,1
(2)二项分布:B(n,p):P(X=k)=Cnkpk(1−p)n−k,k=0,1,⋯,nB(n,p):P(X=k)=C_n^kp^k{(1-p)}^{n-k},k=0,1,\cdots,nB(n,p):P(X=k)=Cnk​pk(1−p)n−k,k=0,1,⋯,n
(3)Poisson分布:p(λ):P(X=k)=λkk!e−λ,λ>0,k=0,1,2⋯p(\lambda):P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},\lambda>0,k=0,1,2\cdotsp(λ):P(X=k)=k!λk​e−λ,λ>0,k=0,1,2⋯
(4)均与分布U(a,b):f(x)={1b−a,a<x<b0U(a,b):f(x)=\left\{\begin{array}{l}\frac1{b-a},a<x<b\\0\end{array}\right.U(a,b):f(x)={b−a1​,a<x<b0​
(5)正态分布:N(μ,σ2):φ(x)=12πσe−(x−μ)22σ2,σ>0,−∞<x<+∞N(\mu,\sigma^2):\varphi(x)=\frac1{\sqrt{2\pi}\sigma}e^{-\frac{{(x-\mu)}^2}{2\sigma^2}},\sigma>0,-\infty<x<+\inftyN(μ,σ2):φ(x)=2π​σ1​e−2σ2(x−μ)2​,σ>0,−∞<x<+∞
(6)指数分布:E(λ):f(x)={λe−λx,x>0,λ>00E(\lambda):f(x)=\left\{\begin{array}{l}\lambda e^{-\lambda x},x>0,\lambda>0\\0\end{array}\right.E(λ):f(x)={λe−λx,x>0,λ>00​
(7)几何分布:G(p):P(X=k)=(1−p)k−1p,0<p<1,k=1,2,⋯G(p):P(X=k)={(1-p)}^{k-1}p,0<p<1,k=1,2,\cdotsG(p):P(X=k)=(1−p)k−1p,0<p<1,k=1,2,⋯
(8)超几何分布:H(N,M,n):P(X=k)=CMkCN−Mn−kCNn,k=0,1,⋯,min(n,M)H(N,M,n):P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,\cdots,min(n,M)H(N,M,n):P(X=k)=CNn​CMk​CN−Mn−k​​,k=0,1,⋯,min(n,M)

6、随机变量函数的概率分布

(1)离散型:P(X=x1)=pi,Y=g(X)P(X=x_1)=p_i,Y=g(X)P(X=x1​)=pi​,Y=g(X),则:P(X=xj)=∑g(xi)=yiP(X=xi)P(X=x_j)={\textstyle\sum_{g(x_i)=y_i}}P(X=x_i)P(X=xj​)=∑g(xi​)=yi​​P(X=xi​)
(2)连续型:X∼fx(x),Y=g(x)X\sim f_x(x),Y=g(x)X∼fx​(x),Y=g(x),则:FY(y)=P(Y≤y)=P(g(X)≤y)=∫g(x)≤yfX(x)dx,fY(y)=Fy′(y)F_Y(y)=P(Y\leq y)=P(g(X)\leq y)=\int_{g(x)\leq y}f_X(x)dx,f_Y(y)=F_y^{'}(y)FY​(y)=P(Y≤y)=P(g(X)≤y)=∫g(x)≤y​fX​(x)dx,fY​(y)=Fy′​(y)

7、重要公式与结论

(1)X∼N(0,1)⇒φ(0)=12π,Φ(0)=12,Φ(−a)=P(X≤−a)=1−Φ(a)X\sim N(0,1)\Rightarrow\varphi(0)=\frac1{\sqrt{2\pi}},\Phi(0)=\frac12,\Phi(-a)=P(X\leq-a)=1-\Phi(a)X∼N(0,1)⇒φ(0)=2π​1​,Φ(0)=21​,Φ(−a)=P(X≤−a)=1−Φ(a)
(2)X∼N(μ,σ2)⇒X−μσ∼N(0,1),P(X≤a)=Φ(a−μσ)X\sim N(\mu,\sigma^2)\Rightarrow\frac{X-\mu}\sigma\sim N(0,1),P(X\leq a)=\Phi(\frac{a-\mu}\sigma)X∼N(μ,σ2)⇒σX−μ​∼N(0,1),P(X≤a)=Φ(σa−μ​)
(3)X∼E(λ)⇒p(X>s+t∣X>s)=P(X>t)X\sim E(\lambda)\Rightarrow p(X>s+t\vert X>s)=P(X>t)X∼E(λ)⇒p(X>s+t∣X>s)=P(X>t)
(4)X∼G(p)⇒p(X=m+k∣X>m)=P(X=k)X\sim G(p)\Rightarrow p(X=m+k\vert X>m)=P(X=k)X∼G(p)⇒p(X=m+k∣X>m)=P(X=k)
(5)离散型随机变量的分布函数为阶梯间断函数:连续型随机变量的分布函数为连续函数,但不一定为处处可导函数。
(6)存在既非离散也非连续型随机变量。

多维随机变量及其分布

1、二维随机变量及其联合分布

由两个随机变量构成的随机向量(X,Y)(X,Y)(X,Y),联合分布为F(x,y)=P(X≤x,Y≤y)F(x,y)=P(X\leq x,Y\leq y)F(x,y)=P(X≤x,Y≤y)

2、二维离散随机变量的分布

(1)联合概率分布律P{X=xi,Y=yj}=pij,i,j=1,2,⋯P\{X=x_i,Y=y_j\}=p_{ij},i,j=1,2,\cdotsP{X=xi​,Y=yj​}=pij​,i,j=1,2,⋯
(2)边缘分布律pi⋅=∑j=1∞pij,i=1,2⋯p⋅j=∑i=1∞pij,j=1,2⋯p_{i\cdot}={\textstyle\sum_{j=1}^\infty}p_{ij},i=1,2\cdots\;\;p_{\cdot j}={\textstyle\sum_{i=1}^\infty}p_{ij},j=1,2\cdotspi⋅​=∑j=1∞​pij​,i=1,2⋯p⋅j​=∑i=1∞​pij​,j=1,2⋯
(3)条件分布律P{X=xi∣Y=yj}=pijp⋅jP{Y=y∣jX=xi}=pijpi⋅P\{X=x_i\vert Y=y_j\}=\frac{p_{ij}}{p_{\cdot j}}\;\;P\{Y=y\vert_jX=x_i\}=\frac{p_{ij}}{p_{i\cdot}}P{X=xi​∣Y=yj​}=p⋅j​pij​​P{Y=y∣j​X=xi​}=pi⋅​pij​​

3、二维连续性随机变量的密度

(1)联合概率分布f(x,y):f(x,y):f(x,y):
1)f(x,y)≥0f(x,y)\geq0\;\;\;\;\;f(x,y)≥0 2)∫−∞+∞f(x,y)d⁡xdy=1\int_{-\infty}^{+\infty}{f(x,y)}\operatorname dxdy=1∫−∞+∞​f(x,y)dxdy=1
(2)分布函数F(x,y)=∫−∞x∫−∞yf(u,v)d⁡udvF(x,y)=\int_{-\infty}^x{\int_{-\infty}^yf(u,v)}\operatorname dudvF(x,y)=∫−∞x​∫−∞y​f(u,v)dudv
(3)边缘概率密度:fX(x)=∫−∞+∞f(x,y)d⁡yfY(y)=∫−∞+∞f(x,y)d⁡xf_X(x)=\int_{-\infty}^{+\infty}{f(x,y)}\operatorname dy\;\;\;f_Y(y)=\int_{-\infty}^{+\infty}{f(x,y)}\operatorname dxfX​(x)=∫−∞+∞​f(x,y)dyfY​(y)=∫−∞+∞​f(x,y)dx
(4)条件概率密度:fX∣Y(x∣y)=f(x,y)fY(y)fY∣X(y∣x)=f(x,y)fX(x)f_{X\vert Y}(x\vert y)=\frac{f(x,y)}{f_Y(y)}\;\;\;\;f_{Y\vert X}(y\vert x)=\frac{f(x,y)}{f_X(x)}fX∣Y​(x∣y)=fY​(y)f(x,y)​fY∣X​(y∣x)=fX​(x)f(x,y)​

4、常见二维随机变量的联合分布

(1)二维均匀分布:(x,y)∼U(D),f(x,y)={1S(D),(x,y)∈D0,其他(x,y)\sim U(D),f(x,y)=\left\{\begin{array}{l}\frac1{S(D)},\;(x,y)\in D\\0,\;\mathrm{其他}\end{array}\right.(x,y)∼U(D),f(x,y)={S(D)1​,(x,y)∈D0,其他​
(2)二维正态分布:(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)(X,Y)∼N(μ1​,μ2​,σ12​,σ22​,ρ) f(x,y)=12πσ1σ21−ρ2⋅exp{−12(1−ρ2)[(x−μ1)2σ12−2ρ(x−μ1)σ1(y−μ2)σ2+(y−μ2)2σ22]}f(x,y)=\frac1{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\cdot exp\left\{\frac{-1}{2(1-\rho^2)}\left[\frac{{(x-\mu_1)}^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)}{\sigma_1}\frac{(y-\mu_2)}{\sigma_2}+\frac{{(y-\mu_2)}^2}{\sigma_2^2}\right]\right\}f(x,y)=2πσ1​σ2​1−ρ2​1​⋅exp{2(1−ρ2)−1​[σ12​(x−μ1​)2​−2ρσ1​(x−μ1​)​σ2​(y−μ2​)​+σ22​(y−μ2​)2​]}

5、随机变量的独立性和相关性

XXX和YYY相互独立⇔F(x,y)=FX(x)FY(y)⇔pij=pi⋅p⋅j(离散型)⇔f(x,y)=fX(x)fY(y)(连续型)\Leftrightarrow F(x,y)=F_X(x)F_Y(y)\Leftrightarrow p_{ij}=p_{i\cdot}p_{\cdot j}(\mathrm{离散型})\Leftrightarrow f(x,y)=f_X(x)f_Y(y)(\mathrm{连续型})⇔F(x,y)=FX​(x)FY​(y)⇔pij​=pi⋅​p⋅j​(离散型)⇔f(x,y)=fX​(x)fY​(y)(连续型)
XXX和YYY的相关性:相关系数ρXY=0\rho_{XY}=0ρXY​=0时,称XXX和YYY不相关,否则称XXX和YYY相关。

6、两个随机变量简单函数的概率分布

离散型:P(X=xi,Y=yj)=pij,Z=g(X,Y)P(X=x_i,Y=y_j)=p_{ij},Z=g(X,Y)P(X=xi​,Y=yj​)=pij​,Z=g(X,Y),则:
P(Z=zk)=P{g(X,Y=zk}=∑g(xi,yi)=zkP(X=xi,Y=yj)P(Z=z_k)=P\left\{g(X,Y=z_k\right\}={\textstyle\sum_{g(x_i,y_i)=z_k}}P(X=x_i,Y=y_j)P(Z=zk​)=P{g(X,Y=zk​}=∑g(xi​,yi​)=zk​​P(X=xi​,Y=yj​)
连续型:(X,Y)∼f(x,y),Z=g(X,Y)(X,Y)\sim f(x,y),Z=g(X,Y)(X,Y)∼f(x,y),Z=g(X,Y),则:
Fz(Z)=P{g(X,Y)≤z}=∬g(x,y)≤zf(x,y)dxdy,fz(Z)=Fz′(Z)F_z(Z)=P\left\{g(X,Y)\leq z\right\}=\iint_{g(x,y)\leq z}f(x,y)dxdy,f_z(Z)=F'_z(Z)Fz​(Z)=P{g(X,Y)≤z}=∬g(x,y)≤z​f(x,y)dxdy,fz​(Z)=Fz′​(Z)

7、重要公式与结论

(1)边缘密度公式:FX(x)=∫−∞+∞f(x,y)d⁡y,FY(y)=∫−∞+∞f(x,y)d⁡xF_X(x)=\int_{-\infty}^{+\infty}f(x,y)\operatorname dy,F_Y(y)=\int_{-\infty}^{+\infty}f(x,y)\operatorname dxFX​(x)=∫−∞+∞​f(x,y)dy,FY​(y)=∫−∞+∞​f(x,y)dx
(2)P{(X,Y)∈D}=∬Df(x,y)dxdyP\left\{(X,Y)\in D\right\}=\iint_Df(x,y)dxdyP{(X,Y)∈D}=∬D​f(x,y)dxdy
(3)若(X,Y)(X,Y)(X,Y)服从二维正态分布N(μ1,μ2,σ12,σ22,ρ)N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)N(μ1​,μ2​,σ12​,σ22​,ρ) ,则有:
1)X∼N(μ1,σ12),Y∼N(μ2,σ22)X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)X∼N(μ1​,σ12​),Y∼N(μ2​,σ22​)
2)XXX与YYY相互独立⇔ρ=0\Leftrightarrow\rho=0⇔ρ=0,即XXX与YYY不相关。
3)C1X+C2Y∼N(C1μ1+C2μ2,C12σ12+C22σ22+2C1C2σ1σ2ρ)C_1X+C_2Y\sim N(C_1\mu_1+C_2\mu_2,C_1^2\sigma_1^2+C_2^2\sigma_2^2+2C_1C_2\sigma_1\sigma_2\rho)C1​X+C2​Y∼N(C1​μ1​+C2​μ2​,C12​σ12​+C22​σ22​+2C1​C2​σ1​σ2​ρ)
4)XXX关于Y=yY=yY=y的条件分布为:N(μ1+ρσ1σ2(y−μ2),σ12(1−ρ2))N(\mu_1+\rho\frac{\sigma_1}{\sigma_2}(y-\mu_2),\sigma_1^2(1-\rho^2))N(μ1​+ρσ2​σ1​​(y−μ2​),σ12​(1−ρ2))
4)YYY关于X=xX=xX=x的条件分布为:N(μ2+ρσ2σ1(y−μ1),σ22(1−ρ2))N(\mu_2+\rho\frac{\sigma_2}{\sigma_1}(y-\mu_1),\sigma_2^2(1-\rho^2))N(μ2​+ρσ1​σ2​​(y−μ1​),σ22​(1−ρ2))
(4)若XXX与YYY独立,且分别服从N(μ1,σ12),N(μ2,σ22)N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)N(μ1​,σ12​),N(μ2​,σ22​),则:
(X,Y)∼N(μ1,μ2,σ12,σ22,0),C1X+C2Y∼N(C1μ1+C2μ2,C12σ12+C22σ22)(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,0) ,C_1X+C_2Y\sim N(C_1\mu_1+C_2\mu_2,C_1^2\sigma_1^2+C_2^2\sigma_2^2)(X,Y)∼N(μ1​,μ2​,σ12​,σ22​,0),C1​X+C2​Y∼N(C1​μ1​+C2​μ2​,C12​σ12​+C22​σ22​)(5)若XXX与YYY相互独立,f(x)f(x)f(x)和g(x)g(x)g(x)为连续函数,则f(X)f(X)f(X)和g(Y)g(Y)g(Y)也相互独立。

随机变量的数字特征

1、数学期望

离散型:P{X=xi}=pi,E(X)=∑ixipiP\left\{X=x_i\right\}=p_i,E(X)={\textstyle\sum_{{}_i}}x_ip_iP{X=xi​}=pi​,E(X)=∑i​​xi​pi​
连续型:X∼f(x),E(X)=∫−∞+∞xf(x)d⁡xX\sim f(x),E(X)=\int_{-\infty}^{+\infty}xf(x)\operatorname dxX∼f(x),E(X)=∫−∞+∞​xf(x)dx
性质:
(1)E(C)=C,E[E(X)]=E(X)E(C)=C,E\left[E(X)\right]=E(X)E(C)=C,E[E(X)]=E(X)
(2)E(C1X+C2Y)=C1E(X)+C2E(Y)E(C_1X+C_2Y)=C_1E(X)+C_2E(Y)E(C1​X+C2​Y)=C1​E(X)+C2​E(Y)
(3)若XXX和YYY独立,则E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)
(4)[E(XY)]2≤E(X2)E(Y2)\left[E(XY)\right]^2\leq E(X^2)E(Y^2)[E(XY)]2≤E(X2)E(Y2)

2、方差、标准差

方差:D(X)=E[X−E(X)]2=E(X2)−[E(X)]2D(X)=E\left[X-E(X)\right]^2=E(X^2)-{\lbrack E(X)\rbrack}^2\;D(X)=E[X−E(X)]2=E(X2)−[E(X)]2
标准差:D(X)\sqrt{D(X)}D(X)​
离散型:D(X)=∑i[xi−E(X)]2piD(X)={\textstyle\sum_i}\left[x_i-E(X)\right]^2p_iD(X)=∑i​[xi​−E(X)]2pi​
连续型:D(X)=∫−∞+∞[x−E(X)]2f(x)d⁡xD(X)=\int_{-\infty}^{+\infty}\left[x-E(X)\right]^2f(x)\operatorname dxD(X)=∫−∞+∞​[x−E(X)]2f(x)dx
性质:
(1)D(C)=0,D[E(X)]=0,D[D(X)]=0D(C)=0,D[E(X)]=0,D[D(X)]=0D(C)=0,D[E(X)]=0,D[D(X)]=0
(2)XXX与YYY相互独立,则D(X±Y)=D(X)+D(Y)D(X±Y)=D(X)+D(Y)D(X±Y)=D(X)+D(Y)
(3)D(C1X+C2)=C12D(X)D(C_1X+C_2)=C_1^2D(X)D(C1​X+C2​)=C12​D(X)
(4)一般有D(X±y)=D(X)+D(Y)±2Cov(X,Y)=D(X)+D(Y)±ρD(X)D(Y)D(X\pm y)=D(X)+D(Y)\pm2Cov(X,Y)=D(X)+D(Y)\pm\rho\sqrt{D(X)}\sqrt{D(Y)}D(X±y)=D(X)+D(Y)±2Cov(X,Y)=D(X)+D(Y)±ρD(X)​D(Y)​
(5)D(X)=E(X−C)2,C≠E(X)D(X)=E{(X-C)}^2,C\neq E(X)D(X)=E(X−C)2,C​=E(X)
(6)D(X)=0⇔P{X=C}=1D(X)=0\Leftrightarrow P\left\{X=C\right\}=1D(X)=0⇔P{X=C}=1

3、随机变量函数的数学期望

(1)对于函数Y=g(x)Y=g(x)Y=g(x)
XXX为离散型:P{X=xi}=pi,E(Y)=∑ig(xi)piP\left\{X=x_i\right\}=p_i,E(Y)={\textstyle\sum_i}g(x_i)p_iP{X=xi​}=pi​,E(Y)=∑i​g(xi​)pi​
XXX为连续型:X∼f(x),E(Y)=∫−∞+∞g(x)f(x)d⁡xX\sim f(x),E(Y)=\int_{-\infty}^{+\infty}g(x)f(x)\operatorname dxX∼f(x),E(Y)=∫−∞+∞​g(x)f(x)dx
(2)Z=g(X,Y);(X,Y)∼P{X=xi,Y=yi}=pij;E(Z)=∑i∑jg(xi,yj)pij(X,Y)∼f(x,y);E(Z)=∫−∞+∞∫−∞+∞g(x,y)f(x,y)d⁡xdyZ=g\left(X,Y\right);\left(X,Y\right)\sim P\left\{X=x_i,Y=y_i\right\}=p_{ij};E(Z)={\textstyle\sum_i}{\textstyle\sum_j}g(x_i,y_j)p_{ij}\\(X,Y)\sim f(x,y);E(Z)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)\operatorname dxdyZ=g(X,Y);(X,Y)∼P{X=xi​,Y=yi​}=pij​;E(Z)=∑i​∑j​g(xi​,yj​)pij​(X,Y)∼f(x,y);E(Z)=∫−∞+∞​∫−∞+∞​g(x,y)f(x,y)dxdy

4、协方差

Cov(X,Y)=E[(X−E(X))(Y−E(Y)]Cov(X,Y)=E\left[(X-E(X))(Y-E(Y)\right]Cov(X,Y)=E[(X−E(X))(Y−E(Y)]

5、相关系数

ρXY=Cov(X,Y)D(X)D(Y)\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}ρXY​=D(X)​D(Y)​Cov(X,Y)​,kkk阶原点矩E(Xk)E(X^k)E(Xk);kkk阶中心距E{[X−E(X)]k}E\left\{\left[X-E(X)\right]^k\right\}E{[X−E(X)]k}
性质:
(1)Cov(X,Y)=Cov(Y,X)Cov(X,Y)=Cov(Y,X)Cov(X,Y)=Cov(Y,X)
(2)Cov(aX,bY)=abCov(Y,X)Cov(aX,bY)=abCov(Y,X)Cov(aX,bY)=abCov(Y,X)
(3)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)Cov(X1​+X2​,Y)=Cov(X1​,Y)+Cov(X2​,Y)
(4)∣ρ(X,Y)∣≤1\left|\rho(X,Y)\right|\leq1∣ρ(X,Y)∣≤1
(5)ρ(X,Y)=1⇔P(Y=aX+b)=1,其中a>0ρ(X,Y)=−1⇔P(Y=aX+b)=1,其中a<0\rho(X,Y)=1\Leftrightarrow P(Y=aX+b)=1,\mathrm{其中}a>0\\\rho(X,Y)=-1\Leftrightarrow P(Y=aX+b)=1,\mathrm{其中}a<0ρ(X,Y)=1⇔P(Y=aX+b)=1,其中a>0ρ(X,Y)=−1⇔P(Y=aX+b)=1,其中a<0

6、重要公式与结论

(1)D(X)=E(X2)−E2(X)(2)Cov(X,Y)=E(X,Y)−E(X)E(Y)(3)ρ(X,Y)=0⇔Cov(X,Y)=0⇔E(X,Y)=E(X)E(Y)⇔D(X±Y)=D(X)+D(Y)(1)D(X)=E(X^2)-E^2(X)\\(2)Cov(X,Y)=E(X,Y)-E(X)E(Y)\\(3)\rho(X,Y)=0\Leftrightarrow Cov(X,Y)=0\Leftrightarrow E(X,Y)=E(X)E(Y)\Leftrightarrow D(X\pm Y)=D(X)+D(Y)(1)D(X)=E(X2)−E2(X)(2)Cov(X,Y)=E(X,Y)−E(X)E(Y)(3)ρ(X,Y)=0⇔Cov(X,Y)=0⇔E(X,Y)=E(X)E(Y)⇔D(X±Y)=D(X)+D(Y)

数理统计的基本概念

1、基本概念

总体:研究对象的全体,它是一个随机变量,用XXX表示。
个体:组成总体的每个基本元素。
简单随机样本:来自总体XXX的nnn个相互独立且与总体同分布的随机变量X1,X2,⋯XnX_1,X_2,\cdots X_nX1​,X2​,⋯Xn​,称为容量为nnn的简单随机样本,简称样本。
统计量:设X1,X2,⋯XnX_1,X_2,\cdots X_nX1​,X2​,⋯Xn​是来自总体XXX的一个样本,g(X1,X2,⋯Xn)g(X_1,X_2,\cdots X_n)g(X1​,X2​,⋯Xn​)是样本的连续函数,且g(⋅)g(\cdot)g(⋅)中不含任何未知参数,则称g(X1,X2,⋯Xn)g(X_1,X_2,\cdots X_n)g(X1​,X2​,⋯Xn​)为统计量
样本均值:X‾=1n∑i=1nXi\overline X=\frac1n{\textstyle\sum_{i=1}^n}X_iX=n1​∑i=1n​Xi​
样本方差:S2=1n−1∑i=1n(Xi−X‾)2S^2=\frac1{n-1}{\textstyle\sum_{i=1}^n}{(X_i-\overline X)}^2S2=n−11​∑i=1n​(Xi​−X)2
样本矩:样本kkk阶原点矩:Ak=1n∑i=1nXik,k=1,2,⋯A_k=\frac1n{\textstyle\sum_{i=1}^n}X_i^k,k=1,2,\cdotsAk​=n1​∑i=1n​Xik​,k=1,2,⋯
样本kkk阶中心矩:Bk=1n∑i=1n(Xi−X‾)k,k=1,2,⋯B_k=\frac1n{\textstyle\sum_{i=1}^n}{(X_i-\overline X)}^k,k=1,2,\cdotsBk​=n1​∑i=1n​(Xi​−X)k,k=1,2,⋯

2、分布

X2\mathcal X^2X2分布X2=X12+X22+⋯+Xn2∼X2(n)\mathcal X^2=X_1^2+X_2^2+\cdots+X_n^2\sim\mathcal X^2(n)X2=X12​+X22​+⋯+Xn2​∼X2(n),其中X1,X2,⋯XnX_1,X_2,\cdots X_nX1​,X2​,⋯Xn​相互独立,且同服从N(0,1)N(0,1)N(0,1)
ttt分布:T=XY/n∼t(n)T=\frac X{\sqrt{Y/n}}\sim t(n)T=Y/n​X​∼t(n),其中X∼N(0,1),Y∼X2(n)X\sim N(0,1),Y\sim\mathcal X^2(n)X∼N(0,1),Y∼X2(n),且X,YX,YX,Y相互独立
FFF分布:F=X/n1Y/n2∼F(n1,n2)F=\frac{X/n_1}{Y/n_2}\sim F(n_1,n_2)F=Y/n2​X/n1​​∼F(n1​,n2​),其中X∼X2(n1),Y∼X2(n2)X\sim\mathcal X^2(n_1),Y\sim\mathcal X^2(n_2)X∼X2(n1​),Y∼X2(n2​),且X,YX,YX,Y相互独立
分位数:若P(X≤xα)=αP(X\leq x_\alpha)=\alphaP(X≤xα​)=α,则称xαx_\alphaxα​为XXX的α\alphaα分位数

3、正态总体的常用样本分布

(1)设X1,X2,⋯XnX_1,X_2,\cdots X_nX1​,X2​,⋯Xn​为来自正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的样本,X‾=1n∑i=1nXi\overline X=\frac1n{\textstyle\sum_{i=1}^n}X_iX=n1​∑i=1n​Xi​,S2=1n−1∑i=1n(Xi−X‾)2S^2=\frac1{n-1}{\textstyle\sum_{i=1}^n}{(X_i-\overline X)}^2S2=n−11​∑i=1n​(Xi​−X)2,则:
1)X‾∼N(μ,σ2n)或者X‾−μσn∼N(0,1)\overline X\sim N(\mu,\frac{\sigma^2}n)\mathrm{或者}\frac{\overline X-\mu}{\frac\sigma{\sqrt n}}\sim N(0,1)X∼N(μ,nσ2​)或者n​σ​X−μ​∼N(0,1)
2)(n−1)S2σ2=1σ2∑i=1n(Xi−X‾)2∼X2(n−1)\frac{(n-1)S^2}{\sigma^2}=\frac1{\sigma^2}{\textstyle\sum_{i=1}^n}{(X_i-\overline X)}^2\sim\mathcal X^2(n-1)σ2(n−1)S2​=σ21​∑i=1n​(Xi​−X)2∼X2(n−1)
3)1σ2∑i=1n(Xi−μ)2∼X2(n)\frac1{\sigma^2}{\textstyle\sum_{i=1}^n}{(X_i-\mu)}^2\sim\mathcal X^2(n)σ21​∑i=1n​(Xi​−μ)2∼X2(n)
4)X‾−μSn∼t(n−1)\frac{\overline X-\mu}{\displaystyle\frac S{\sqrt n}}\sim t(n-1)n​S​X−μ​∼t(n−1)

4、重要公式与结论

(1)对于X2∼X2(n)\mathcal X^2\sim\mathcal X^2(n)X2∼X2(n),有E(X2(n))=n,D(X2(n))=2nE(\mathcal X^2(n))=n,D(\mathcal X^2(n))=2nE(X2(n))=n,D(X2(n))=2n
(2)对于T∼t(n)T\sim t(n)T∼t(n),有E(T)=0,D(T)=nn−2(n>2)E(T)=0,D(T)=\frac n{n-2}(n>2)E(T)=0,D(T)=n−2n​(n>2)
(3)对于F∼F(m,n)F\sim F(m,n)F∼F(m,n),有1F∼F(m,n),Fα/2(m,n)=1F1−α/2(n,m)\frac1F\sim F(m,n),F_{\alpha/2}(m,n)=\frac1{F_{1-_{\alpha/2}}(n,m)}F1​∼F(m,n),Fα/2​(m,n)=F1−α/2​​(n,m)1​
(4)对于任意总体XXX,有E(X‾)=E(X),E(S2)=D(X),D(X‾)=D(X)nE(\overline X)=E(X),E(S^2)=D(X),D(\overline X)=\frac{D(X)}nE(X)=E(X),E(S2)=D(X),D(X)=nD(X)​

AI学习笔记(一) 人工智能初识及数学基础相关推荐

  1. AI学习笔记:人工智能与机器学习概述

    一.人工智能基本概念 1.1 基本概念 数据分析:对历史规律的展现.对未来数据的预测. 机器学习:机器学习是指从一系列的原始数据中找到规律,提取人们可以识别的特征,然后通过学习这些特征,最终产生一个模 ...

  2. AI学习笔记之——如何理解机器学习(Machine Learning)

    前面虽然介绍了概率和贝叶斯网络,但是还是没有正式介绍AI中最重要的算法--机器学习.如果说概率论是机器学习的基石,那么机器学习算法和理论就是支撑整个AI系统的支柱.现在比较火的深度学习神经网路等等其实 ...

  3. AI学习笔记--人机对话的四种形态

    AI学习笔记--人机对话的四种形态 ><div class="show-content-free"><p>最近在筹备转行 AI PM 由于之前的产品线 ...

  4. AI学习笔记(十五)自然语言处理基本概念

    目录 AI学习笔记之自然语言处理 自然语言处理(Natural Language Processing) 自然语言简介 自然语言处理的难点 自然语言处理的现状 基于深度学习的自然语言处理 NLP的处理 ...

  5. AI学习笔记(十三)CNN之人脸检测

    AI学习笔记之CNN之人脸检测 人脸检测 人脸检测概念 人脸检测的难点 人脸检测的主要用途 mtcnn 主要步骤 构建图像金字塔 P-Net(Proposal Network) R-Net(Refin ...

  6. AI学习笔记(十一)CNN之图像识别(上)

    AI学习笔记之CNN之图像识别(上) 图像识别 图像识别简介 模式识别 图像识别的过程 图像识别的应用 分类与检测 VGG Resnet 迁移学习&inception 卷积神经网络迁移学习fi ...

  7. AI学习笔记——Bias and Variance tradeoff (方差偏差的平衡)

    上一篇文章介绍了机器学习中需要理解的几个重要概念,这些概念在训练模型的过程中至关重要,尤其是Bias 和 Variance 的分析,关系到在机器学习的过程的实际操作中,如何优化训练模型. 1.Bias ...

  8. extjs 提交表单给php,JavaScript_Extjs学习笔记之二 初识Extjs之Form,Extjs中的表单组件是Ext.form.Basic - phpStudy...

    Extjs学习笔记之二 初识Extjs之Form Extjs中的表单组件是Ext.form.BasicForm,不过最简单最常用的是Ext.form.FormPanel控件,它继承自Panel,具有一 ...

  9. AI学习笔记(十四)CNN之图像分割

    AI学习笔记之CNN之图像分割 图像分割 问题引入 实现技术手段及分类 语义分割-FCN(Fully Convolutional Networks) FCN--deconv 反卷积的具体步骤 Unpo ...

  10. AI学习笔记(十一)CNN之图像识别(下)

    AI学习笔记之CNN之图像识别(下) 图像识别 图像识别简介 模式识别 图像识别的过程 图像识别的应用 分类与检测 VGG Resnet 迁移学习&inception 卷积神经网络迁移学习fi ...

最新文章

  1. 【代码保留】表删除/重命名(含中文与空格)
  2. lua学习笔记之字符串
  3. 搭建nfs共享存储服务之一nfs服务端搭建
  4. 微软Build 2016前瞻:让开发者编写能畅行所有设备的app
  5. oracle堆,oracle被一堆insert和update堵死解决方案
  6. python是一种面向过程的编程语言_python协成与面向过程编程
  7. waring Release版本
  8. java怎么设计一个系统吗_谁能帮我设计一个Java的文件管理系统谢谢各位
  9. ubuntu设置开机启动图形应用程序,替换默认图形桌面
  10. 用HTML5实现十里桃花歌词的打印(一)
  11. 向量叉乘算子、点乘算子与矩阵运算的关系
  12. 网络爬虫工作原理分析
  13. matlab impixel的用法
  14. Linux安装高版本tshark(3.x版本)
  15. 新纪元财务、进销存一体化软件 v4.0 官方
  16. 对 BFC 规范(块级格式化上下文:block formatting context)的理解?
  17. 「自控原理」4.2 根轨迹法分析与校正
  18. 教你怎么在Pycharm上安装Manim(Pycharm+Manim)
  19. 7-3 表达式求值_1 (20分) 简单代码
  20. Java、JSP电影订票网站的设计与开发

热门文章

  1. html输入文本颜色,Input输入字体颜色改变js(兼容IE)
  2. 程序解码错误:Accept-Encoding“: “gzip, deflate, br
  3. 福昕阅读器和adobe reader dc护眼背景色设置
  4. 机械自动化原理动图,你都见过吗?
  5. oracle rman备份时间点,Oracle Rman 控制RMAN的备份时间,减少IO消耗
  6. C# 写csv文件 使用Excel打开 中文乱码
  7. 2023-2029年中国AI音箱行业运营现状及发展前景预测报告
  8. 一加手机如何拷贝公交卡_一加5T怎么刷公交卡?一加5T手机NFC刷公交卡详细图文教程...
  9. 计算机课程反馈,课程总结与反馈 学习教育技术的收获
  10. Pe怎么备份linux数据,如何用PE给电脑系统做备份