多元统计分析例题及程序

  • 主成分分析
    • 简述
    • 基本思想
    • 计算步骤
    • 例题
    • 程序
    • 程序理解
  • 因子分析
  • 相关性分析
  • 回归分析
    • 一元回归例题
  • 聚类分析

主成分分析

简述

  1. 主成分分析(Principal Component Analysis,PCA), 是一种数学降维的统计方法。
  2. 通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
  3. 在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。
  4. 主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。

基本思想

  1. 主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。
  2. 主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,将其线性组合作为新的综合指标。达到降维的目的。

计算步骤

#mermaid-svg-7fxLdnaeimyRfcG0 .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .label text{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .node rect,#mermaid-svg-7fxLdnaeimyRfcG0 .node circle,#mermaid-svg-7fxLdnaeimyRfcG0 .node ellipse,#mermaid-svg-7fxLdnaeimyRfcG0 .node polygon,#mermaid-svg-7fxLdnaeimyRfcG0 .node path{fill:#ECECFF;stroke:#9370db;stroke-width:1px}#mermaid-svg-7fxLdnaeimyRfcG0 .node .label{text-align:center;fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .node.clickable{cursor:pointer}#mermaid-svg-7fxLdnaeimyRfcG0 .arrowheadPath{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .edgePath .path{stroke:#333;stroke-width:1.5px}#mermaid-svg-7fxLdnaeimyRfcG0 .flowchart-link{stroke:#333;fill:none}#mermaid-svg-7fxLdnaeimyRfcG0 .edgeLabel{background-color:#e8e8e8;text-align:center}#mermaid-svg-7fxLdnaeimyRfcG0 .edgeLabel rect{opacity:0.9}#mermaid-svg-7fxLdnaeimyRfcG0 .edgeLabel span{color:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .cluster rect{fill:#ffffde;stroke:#aa3;stroke-width:1px}#mermaid-svg-7fxLdnaeimyRfcG0 .cluster text{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 div.mermaidTooltip{position:absolute;text-align:center;max-width:200px;padding:2px;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);font-size:12px;background:#ffffde;border:1px solid #aa3;border-radius:2px;pointer-events:none;z-index:100}#mermaid-svg-7fxLdnaeimyRfcG0 .actor{stroke:#ccf;fill:#ECECFF}#mermaid-svg-7fxLdnaeimyRfcG0 text.actor>tspan{fill:#000;stroke:none}#mermaid-svg-7fxLdnaeimyRfcG0 .actor-line{stroke:grey}#mermaid-svg-7fxLdnaeimyRfcG0 .messageLine0{stroke-width:1.5;stroke-dasharray:none;stroke:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .messageLine1{stroke-width:1.5;stroke-dasharray:2, 2;stroke:#333}#mermaid-svg-7fxLdnaeimyRfcG0 #arrowhead path{fill:#333;stroke:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .sequenceNumber{fill:#fff}#mermaid-svg-7fxLdnaeimyRfcG0 #sequencenumber{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 #crosshead path{fill:#333;stroke:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .messageText{fill:#333;stroke:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .labelBox{stroke:#ccf;fill:#ECECFF}#mermaid-svg-7fxLdnaeimyRfcG0 .labelText,#mermaid-svg-7fxLdnaeimyRfcG0 .labelText>tspan{fill:#000;stroke:none}#mermaid-svg-7fxLdnaeimyRfcG0 .loopText,#mermaid-svg-7fxLdnaeimyRfcG0 .loopText>tspan{fill:#000;stroke:none}#mermaid-svg-7fxLdnaeimyRfcG0 .loopLine{stroke-width:2px;stroke-dasharray:2, 2;stroke:#ccf;fill:#ccf}#mermaid-svg-7fxLdnaeimyRfcG0 .note{stroke:#aa3;fill:#fff5ad}#mermaid-svg-7fxLdnaeimyRfcG0 .noteText,#mermaid-svg-7fxLdnaeimyRfcG0 .noteText>tspan{fill:#000;stroke:none}#mermaid-svg-7fxLdnaeimyRfcG0 .activation0{fill:#f4f4f4;stroke:#666}#mermaid-svg-7fxLdnaeimyRfcG0 .activation1{fill:#f4f4f4;stroke:#666}#mermaid-svg-7fxLdnaeimyRfcG0 .activation2{fill:#f4f4f4;stroke:#666}#mermaid-svg-7fxLdnaeimyRfcG0 .mermaid-main-font{font-family:"trebuchet ms", verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 .section{stroke:none;opacity:0.2}#mermaid-svg-7fxLdnaeimyRfcG0 .section0{fill:rgba(102,102,255,0.49)}#mermaid-svg-7fxLdnaeimyRfcG0 .section2{fill:#fff400}#mermaid-svg-7fxLdnaeimyRfcG0 .section1,#mermaid-svg-7fxLdnaeimyRfcG0 .section3{fill:#fff;opacity:0.2}#mermaid-svg-7fxLdnaeimyRfcG0 .sectionTitle0{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .sectionTitle1{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .sectionTitle2{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .sectionTitle3{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .sectionTitle{text-anchor:start;font-size:11px;text-height:14px;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 .grid .tick{stroke:#d3d3d3;opacity:0.8;shape-rendering:crispEdges}#mermaid-svg-7fxLdnaeimyRfcG0 .grid .tick text{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 .grid path{stroke-width:0}#mermaid-svg-7fxLdnaeimyRfcG0 .today{fill:none;stroke:red;stroke-width:2px}#mermaid-svg-7fxLdnaeimyRfcG0 .task{stroke-width:2}#mermaid-svg-7fxLdnaeimyRfcG0 .taskText{text-anchor:middle;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 .taskText:not([font-size]){font-size:11px}#mermaid-svg-7fxLdnaeimyRfcG0 .taskTextOutsideRight{fill:#000;text-anchor:start;font-size:11px;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 .taskTextOutsideLeft{fill:#000;text-anchor:end;font-size:11px}#mermaid-svg-7fxLdnaeimyRfcG0 .task.clickable{cursor:pointer}#mermaid-svg-7fxLdnaeimyRfcG0 .taskText.clickable{cursor:pointer;fill:#003163 !important;font-weight:bold}#mermaid-svg-7fxLdnaeimyRfcG0 .taskTextOutsideLeft.clickable{cursor:pointer;fill:#003163 !important;font-weight:bold}#mermaid-svg-7fxLdnaeimyRfcG0 .taskTextOutsideRight.clickable{cursor:pointer;fill:#003163 !important;font-weight:bold}#mermaid-svg-7fxLdnaeimyRfcG0 .taskText0,#mermaid-svg-7fxLdnaeimyRfcG0 .taskText1,#mermaid-svg-7fxLdnaeimyRfcG0 .taskText2,#mermaid-svg-7fxLdnaeimyRfcG0 .taskText3{fill:#fff}#mermaid-svg-7fxLdnaeimyRfcG0 .task0,#mermaid-svg-7fxLdnaeimyRfcG0 .task1,#mermaid-svg-7fxLdnaeimyRfcG0 .task2,#mermaid-svg-7fxLdnaeimyRfcG0 .task3{fill:#8a90dd;stroke:#534fbc}#mermaid-svg-7fxLdnaeimyRfcG0 .taskTextOutside0,#mermaid-svg-7fxLdnaeimyRfcG0 .taskTextOutside2{fill:#000}#mermaid-svg-7fxLdnaeimyRfcG0 .taskTextOutside1,#mermaid-svg-7fxLdnaeimyRfcG0 .taskTextOutside3{fill:#000}#mermaid-svg-7fxLdnaeimyRfcG0 .active0,#mermaid-svg-7fxLdnaeimyRfcG0 .active1,#mermaid-svg-7fxLdnaeimyRfcG0 .active2,#mermaid-svg-7fxLdnaeimyRfcG0 .active3{fill:#bfc7ff;stroke:#534fbc}#mermaid-svg-7fxLdnaeimyRfcG0 .activeText0,#mermaid-svg-7fxLdnaeimyRfcG0 .activeText1,#mermaid-svg-7fxLdnaeimyRfcG0 .activeText2,#mermaid-svg-7fxLdnaeimyRfcG0 .activeText3{fill:#000 !important}#mermaid-svg-7fxLdnaeimyRfcG0 .done0,#mermaid-svg-7fxLdnaeimyRfcG0 .done1,#mermaid-svg-7fxLdnaeimyRfcG0 .done2,#mermaid-svg-7fxLdnaeimyRfcG0 .done3{stroke:grey;fill:#d3d3d3;stroke-width:2}#mermaid-svg-7fxLdnaeimyRfcG0 .doneText0,#mermaid-svg-7fxLdnaeimyRfcG0 .doneText1,#mermaid-svg-7fxLdnaeimyRfcG0 .doneText2,#mermaid-svg-7fxLdnaeimyRfcG0 .doneText3{fill:#000 !important}#mermaid-svg-7fxLdnaeimyRfcG0 .crit0,#mermaid-svg-7fxLdnaeimyRfcG0 .crit1,#mermaid-svg-7fxLdnaeimyRfcG0 .crit2,#mermaid-svg-7fxLdnaeimyRfcG0 .crit3{stroke:#f88;fill:red;stroke-width:2}#mermaid-svg-7fxLdnaeimyRfcG0 .activeCrit0,#mermaid-svg-7fxLdnaeimyRfcG0 .activeCrit1,#mermaid-svg-7fxLdnaeimyRfcG0 .activeCrit2,#mermaid-svg-7fxLdnaeimyRfcG0 .activeCrit3{stroke:#f88;fill:#bfc7ff;stroke-width:2}#mermaid-svg-7fxLdnaeimyRfcG0 .doneCrit0,#mermaid-svg-7fxLdnaeimyRfcG0 .doneCrit1,#mermaid-svg-7fxLdnaeimyRfcG0 .doneCrit2,#mermaid-svg-7fxLdnaeimyRfcG0 .doneCrit3{stroke:#f88;fill:#d3d3d3;stroke-width:2;cursor:pointer;shape-rendering:crispEdges}#mermaid-svg-7fxLdnaeimyRfcG0 .milestone{transform:rotate(45deg) scale(0.8, 0.8)}#mermaid-svg-7fxLdnaeimyRfcG0 .milestoneText{font-style:italic}#mermaid-svg-7fxLdnaeimyRfcG0 .doneCritText0,#mermaid-svg-7fxLdnaeimyRfcG0 .doneCritText1,#mermaid-svg-7fxLdnaeimyRfcG0 .doneCritText2,#mermaid-svg-7fxLdnaeimyRfcG0 .doneCritText3{fill:#000 !important}#mermaid-svg-7fxLdnaeimyRfcG0 .activeCritText0,#mermaid-svg-7fxLdnaeimyRfcG0 .activeCritText1,#mermaid-svg-7fxLdnaeimyRfcG0 .activeCritText2,#mermaid-svg-7fxLdnaeimyRfcG0 .activeCritText3{fill:#000 !important}#mermaid-svg-7fxLdnaeimyRfcG0 .titleText{text-anchor:middle;font-size:18px;fill:#000;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 g.classGroup text{fill:#9370db;stroke:none;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);font-size:10px}#mermaid-svg-7fxLdnaeimyRfcG0 g.classGroup text .title{font-weight:bolder}#mermaid-svg-7fxLdnaeimyRfcG0 g.clickable{cursor:pointer}#mermaid-svg-7fxLdnaeimyRfcG0 g.classGroup rect{fill:#ECECFF;stroke:#9370db}#mermaid-svg-7fxLdnaeimyRfcG0 g.classGroup line{stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 .classLabel .box{stroke:none;stroke-width:0;fill:#ECECFF;opacity:0.5}#mermaid-svg-7fxLdnaeimyRfcG0 .classLabel .label{fill:#9370db;font-size:10px}#mermaid-svg-7fxLdnaeimyRfcG0 .relation{stroke:#9370db;stroke-width:1;fill:none}#mermaid-svg-7fxLdnaeimyRfcG0 .dashed-line{stroke-dasharray:3}#mermaid-svg-7fxLdnaeimyRfcG0 #compositionStart{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 #compositionEnd{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 #aggregationStart{fill:#ECECFF;stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 #aggregationEnd{fill:#ECECFF;stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 #dependencyStart{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 #dependencyEnd{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 #extensionStart{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 #extensionEnd{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 .commit-id,#mermaid-svg-7fxLdnaeimyRfcG0 .commit-msg,#mermaid-svg-7fxLdnaeimyRfcG0 .branch-label{fill:lightgrey;color:lightgrey;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 .pieTitleText{text-anchor:middle;font-size:25px;fill:#000;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 .slice{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 g.stateGroup text{fill:#9370db;stroke:none;font-size:10px;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 g.stateGroup text{fill:#9370db;fill:#333;stroke:none;font-size:10px}#mermaid-svg-7fxLdnaeimyRfcG0 g.statediagram-cluster .cluster-label text{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 g.stateGroup .state-title{font-weight:bolder;fill:#000}#mermaid-svg-7fxLdnaeimyRfcG0 g.stateGroup rect{fill:#ECECFF;stroke:#9370db}#mermaid-svg-7fxLdnaeimyRfcG0 g.stateGroup line{stroke:#9370db;stroke-width:1}#mermaid-svg-7fxLdnaeimyRfcG0 .transition{stroke:#9370db;stroke-width:1;fill:none}#mermaid-svg-7fxLdnaeimyRfcG0 .stateGroup .composit{fill:white;border-bottom:1px}#mermaid-svg-7fxLdnaeimyRfcG0 .stateGroup .alt-composit{fill:#e0e0e0;border-bottom:1px}#mermaid-svg-7fxLdnaeimyRfcG0 .state-note{stroke:#aa3;fill:#fff5ad}#mermaid-svg-7fxLdnaeimyRfcG0 .state-note text{fill:black;stroke:none;font-size:10px}#mermaid-svg-7fxLdnaeimyRfcG0 .stateLabel .box{stroke:none;stroke-width:0;fill:#ECECFF;opacity:0.7}#mermaid-svg-7fxLdnaeimyRfcG0 .edgeLabel text{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .stateLabel text{fill:#000;font-size:10px;font-weight:bold;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-7fxLdnaeimyRfcG0 .node circle.state-start{fill:black;stroke:black}#mermaid-svg-7fxLdnaeimyRfcG0 .node circle.state-end{fill:black;stroke:white;stroke-width:1.5}#mermaid-svg-7fxLdnaeimyRfcG0 #statediagram-barbEnd{fill:#9370db}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-cluster rect{fill:#ECECFF;stroke:#9370db;stroke-width:1px}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-cluster rect.outer{rx:5px;ry:5px}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-state .divider{stroke:#9370db}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-state .title-state{rx:5px;ry:5px}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-cluster.statediagram-cluster .inner{fill:white}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-cluster.statediagram-cluster-alt .inner{fill:#e0e0e0}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-cluster .inner{rx:0;ry:0}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-state rect.basic{rx:5px;ry:5px}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-state rect.divider{stroke-dasharray:10,10;fill:#efefef}#mermaid-svg-7fxLdnaeimyRfcG0 .note-edge{stroke-dasharray:5}#mermaid-svg-7fxLdnaeimyRfcG0 .statediagram-note rect{fill:#fff5ad;stroke:#aa3;stroke-width:1px;rx:0;ry:0}:root{--mermaid-font-family: '"trebuchet ms", verdana, arial';--mermaid-font-family: "Comic Sans MS", "Comic Sans", cursive}#mermaid-svg-7fxLdnaeimyRfcG0 .error-icon{fill:#522}#mermaid-svg-7fxLdnaeimyRfcG0 .error-text{fill:#522;stroke:#522}#mermaid-svg-7fxLdnaeimyRfcG0 .edge-thickness-normal{stroke-width:2px}#mermaid-svg-7fxLdnaeimyRfcG0 .edge-thickness-thick{stroke-width:3.5px}#mermaid-svg-7fxLdnaeimyRfcG0 .edge-pattern-solid{stroke-dasharray:0}#mermaid-svg-7fxLdnaeimyRfcG0 .edge-pattern-dashed{stroke-dasharray:3}#mermaid-svg-7fxLdnaeimyRfcG0 .edge-pattern-dotted{stroke-dasharray:2}#mermaid-svg-7fxLdnaeimyRfcG0 .marker{fill:#333}#mermaid-svg-7fxLdnaeimyRfcG0 .marker.cross{stroke:#333}:root { --mermaid-font-family: "trebuchet ms", verdana, arial;}#mermaid-svg-7fxLdnaeimyRfcG0 {color: rgba(0, 0, 0, 0.75);font: ;}

原始数据标准化
计算相关系数矩阵
计算特征向量和特征值
选取主成分
计算综合得分

原始数据的标准化

  1. 采集m维随机向量 x=(x1,x2,⋯,xm)Tx=(x_{1},x_{2},\cdots,x_{m})^{T}x=(x1​,x2​,⋯,xm​)T
  2. 抽取n个样品xi=(xi1,xi2,⋯,xim)T,i=1,2,...,nx_{i}=(x_{i1},x_{i2},\cdots,x_{im})^{T},i=1,2,...,nxi​=(xi1​,xi2​,⋯,xim​)T,i=1,2,...,n。且有n>pn>pn>p
  3. 构造样本数据矩阵x=(x11x12⋯x1mx21x22⋯x2m⋮⋮⋮⋮xn1xn2⋯xnm)x=\begin{pmatrix} x_{11} &x_{12} &\cdots &x_{1m} \\ x_{21} &x_{22} &\cdots &x_{2m} \\ \vdots &\vdots &\vdots &\vdots \\ x_{n1} &x_{n2} &\cdots &x_{nm} \end{pmatrix}x=⎝⎜⎜⎜⎛​x11​x21​⋮xn1​​x12​x22​⋮xn2​​⋯⋯⋮⋯​x1m​x2m​⋮xnm​​⎠⎟⎟⎟⎞​
  4. 标准化变换:xij′=xij−xjˉsjx_{ij}'=\frac{x_{ij}-\bar{x_{j}}}{s_{j}}xij′​=sj​xij​−xj​ˉ​​其中,xjˉ=1n∑i=1nxij,sj2=1n−1∑i=1n(xij−xjˉ)2\bar{x_{j}}=\frac{1}{n}\sum \limits _{i=1}^{n}x_{ij},\quad s_{j}^{2}=\frac{1}{n-1}\sum\limits _{i=1}^{n}(x_{ij}-\bar{x_{j}})^{2}xj​ˉ​=n1​i=1∑n​xij​,sj2​=n−11​i=1∑n​(xij​−xj​ˉ​)2。

计算相关系数矩阵R
R=(r11r12⋯r1mr21r22⋯r2m⋮⋮⋮⋮rn1rn2⋯rnm)R=\begin{pmatrix} r_{11} &r_{12} &\cdots &r_{1m} \\ r_{21} &r_{22} &\cdots &r_{2m} \\ \vdots &\vdots &\vdots &\vdots \\ r_{n1} &r_{n2} &\cdots &r_{nm} \end{pmatrix}R=⎝⎜⎜⎜⎛​r11​r21​⋮rn1​​r12​r22​⋮rn2​​⋯⋯⋮⋯​r1m​r2m​⋮rnm​​⎠⎟⎟⎟⎞​
其中,rij=1n−1∑k=1nxkixkj,n>1,i,j=1,2,⋯,mr_{ij}=\frac{1}{n-1}\sum\limits _{k=1}^{n}x_{ki}x_{kj},\quad n>1,\quad i,j=1,2,\cdots,mrij​=n−11​k=1∑n​xki​xkj​,n>1,i,j=1,2,⋯,m

特征向量和特征值

  1. 解特征方程∣λI−R∣=0|\lambda I-R|=0∣λI−R∣=0
  2. 可得特征值λ1⩾λ2⩾⋯λm⩾0\lambda _{1}\geqslant \lambda _{2}\geqslant \cdots \lambda _{m}\geqslant 0λ1​⩾λ2​⩾⋯λm​⩾0
  3. 以及对应的特征向量u1,u2,⋯,um,u_{1},u_{2},\cdots,u_{m},u1​,u2​,⋯,um​,
  4. 其中 uj=(u1j,u2j,⋯,umj)Tu_{j}=(u_{1j},u_{2j},\cdots,u_{mj})^{T}uj​=(u1j​,u2j​,⋯,umj​)T
  5. 且∥uj∥=1,j=1,2,⋯,m\|u_{j}\|=1,j=1,2,\cdots,m∥uj​∥=1,j=1,2,⋯,m
  6. 则第jjj个主成分为 yj=u1jx1+u2jx2+⋯+umjxm,y_{j}=u_{1j}x_{1}+u_{2j}x_{2}+\cdots+u_{mj}x_{m},yj​=u1j​x1​+u2j​x2​+⋯+umj​xm​,其中,xj=(x1j,x2j,⋯,xmj)T,j=1,2,⋯,mx_{j}=(x_{1j},x_{2j},\cdots,x_{mj})^{T},j=1,2,\cdots ,mxj​=(x1j​,x2j​,⋯,xmj​)T,j=1,2,⋯,m

对特征值和特征向量的求解,可以列一个直观的表格。

选取主成分

  1. 第jjj个成分的贡献率为βj=λj∑k=1mλk(j=1,2,⋯m)\beta_{j}=\frac{\lambda _{j}}{\sum \limits _{k=1}^{m}\lambda _{k}}\quad \left ( j=1,2,\cdots m \right )βj​=k=1∑m​λk​λj​​(j=1,2,⋯m)
  2. 前ppp个成分的累计贡献率为αp=∑k=1pλk∑k=1mλk\alpha_{p}=\frac{\sum \limits _{k=1}^{p}\lambda _{k}}{\sum \limits _{k=1}^{m}\lambda _{k}}αp​=k=1∑m​λk​k=1∑p​λk​​
  3. 各成分的方差是递减的,包含的信息也是递减的。实践中一般选取αp⩾85%\alpha_{p}\geqslant85\%αp​⩾85%

计算综合得分Z
Z=∑j=1pβjyjZ=\sum \limits _{j=1}^{p}\beta _{j}y_{j}Z=j=1∑p​βj​yj​

例题

下表是我国1984-2000年宏观投资的一些数据,试利用主成分分析对投资效益进行分析和排序

程序

data=xlsread('data.xlsx');      %导入数据
X=zscore(data);                 %标准化数据
R=corrcoef(X);                  %求相关系数矩阵
[vec,lamba,rate]=pcacov(R);     %主成分分析,vec为R特征向量,lamba为R特征值,rate为各个主成分贡献率
vec=vec./sign(sum(vec))         %使特征向量和为正
contr=cumsum(rate)/sum(rate);   %求贡献率
contr'                          %显示贡献率
num=input('请输入主成分个数:'); %交互式选取主成分个数
df=X*vec(:,1:num);              %计算各主成的得分
tf=df*rate(1:num)/100;          %计算综合得分
[stf,ind]=sort(tf,'descend');   %把得分按照降序排列
[ind,stf]                       %显示排名

程序理解

X=zscore(data);
来自知乎

R=corrcoef(X);
12、13函数


matlab中princomp,pcacov,pcares,barttest四大分析函数的应用如下:

1.princomp

  1. 功能:主成分分析
  2. 格式:PC=princomp(X)
   [PC,SCORE,latent,tsquare]=princomp(X)

说明:[PC,SCORE,latent,tsquare]=princomp(X)对数据矩阵X进行主成分分析,给出各主成分(PC)、所谓的Z-得分
(SCORE)、X的方差矩阵的特征值(latent)和每个数据点的HotellingT2统计量(tsquare)。

2.pcacov

1.功能:运用协方差矩阵进行主成分分析
格式:PC=pcacov(X)

[PC,latent,explained]=pcacov(X)

说明:[PC,latent,explained]=pcacov(X)
通过协方差矩阵X进行主成分分析
返回主成分(PC)、协方差矩阵X的特征值(latent)和每个特征向量表征在观测量总方差中所占的百分数(explained)。

3.pcares

  1. 功能:主成分分析的残差
  2. 格式:residuals=pcares(X,ndim)

说明:pcares(X,ndim)返回保留X的ndim个主成分所获的残差。
注意,ndim是一个标量,必须小于X的列数。
而且,X是数据矩阵,而不是协方差矩阵。

4.barttest

  1. 功能:主成分的巴特力特检验
  2. 格式:ndim=barttest(X,alpha)
 [ndim,prob,chisquare]=barttest(X,alpha)

说明:巴特力特检验是一种等方差性检验。
ndim=barttest(X,alpha)是在显著性水平alpha下,给出满足数据矩阵X的非随机变量的n维模型,ndim即模型维数,它由一系列假设检验所确定,ndim=1表明数据X对应于每个主成分的方差是相同的;ndim=2表明数据X对应于第二成分及其余成分的方差是相同的。

因子分析

相关性分析

回归分析

一元回归例题

clc,clear
x=[594 638 1122 1155 1408 1595 1969 2078 2585 2530];
y=[800 1100 1400 1700 2000 2300 2600 2900 3200 3500];
plot(x,y,'*') %画出y-x散点图
x=x';Y=y';
X=[ones(10,1),x]; %构造回归分析的数据矩阵
[beta,betaint,r,rint,st]=regress(Y,X)  %计算回归系数和统计量
%beta:回归系数,betaint:回归系数置信区间,r:残差,rint:残差0.95的置信区间
%st:x统计量,其分量对应R?、F 、P 、s?

聚类分析

数学建模——多元统计分析例题及程序相关推荐

  1. 数学建模 —— 多元回归分析

    文章目录 前言 一.回归分析的分类 二.分析流程 三.注意事项 前言 回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决.回归分析的任务就是,通过研究自 ...

  2. 数学建模多元线性回归内生性问题的蒙特卡洛模拟matlab代码

    回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决.回归分析的任务就是,通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预 ...

  3. 数学建模——多元线性回归 /多元线性拟合 (工具:matlab)

    文章目录 一.多元线性回归是什么 二.样例及代码 第一步:画散点图进行分析 第二步:拟合 三.总结: 四.参考附录: 技巧篇

  4. 2016数学建模国赛A题程序(原创)作者cclplus

    也可以在我的github上找到这段代码 https://github.com/YuruTu/CUMCM2016A clear all; close all; clc format long syms ...

  5. 数学建模之2016国赛A题程序(来源于cclplus)

    友情链接: (1)2016数学建模国赛A题程序(原创)作者cclplus https://blog.csdn.net/m0_37772174/article/details/80204533 也可以在 ...

  6. Maltab在数学建模中的应用(第二版)——读书笔记上

    Maltab在数学建模中的应用(第二版)--读书笔记上 1.MATLAB与数据文件的交互 1.1数据拟合 1.2数据拟合实例 1.3数据可视化 1.4层次分析法 2.规划问题的MATLAB求解(多约束 ...

  7. 数学建模 概率空间与统计结构

    概率空间与统计结构 学习数学建模,我们的任务不再是求解那种被人设计好的习题,而是面对的各类实际问题.我们打算运用概率分析的方法或者统计分析的方法对这些实际问题进行研究,但是概率分析理论.统计分析理论都 ...

  8. 数学建模层次分析法例题及答案_【热门推荐】影响力意志力创新力、数学建模简明教程...

    <影响力•意志力•创新力> 索书号:B848.4-49/1028 作者:邢群麟编著 出版社:浙江工商大学出版社,2018 馆藏地:新馆304室 简介:本书在总结众多成功人士经验的基础上, ...

  9. 2022年数维杯数学建模C题 电动汽车充电站的部署优化策略求解全过程文档及程序

    2022年数维杯数学建模 C题 电动汽车充电站的部署优化策略 原题再现:   近年来,随着化石能源的逐渐枯竭和环境污染的不断加剧,电动汽车(EV)作为传统燃油车的主要替代品之一,得到了快速的发展.据国 ...

最新文章

  1. 32位汇编编程模板--使用masm6.15环境
  2. python读取整个txt文件-python怎么读取txt文件内容
  3. Twitter-Snowflake,64位自增ID算法详解
  4. 干货 | 杨文韬:秘B类App如何手持大型武器还能高速奔跑
  5. CLR Essential Types
  6. 阿里云视频云编码优化的思考与发现
  7. CAP-分布式事务的解决方案
  8. [css] 如何让大小不同的图片等比缩放不变形显示在固定大小的div里?写个例子
  9. openmp与openmpi区别
  10. SSH访问远程主机超时问题解决
  11. Matlab排序函数sort()和sortrows()
  12. 7.数据归档(Archiver)
  13. Android MVP之kotlin初体验
  14. 在做了在做了!次世代迭代进展让你一睹为快!【新倩女幽魂OL】
  15. 教程丨GIS制图教程01
  16. Android机应用多开分身CK获取ksjsb-jrttjsb-aqc羊毛
  17. usermod -a -G group1 user1
  18. c语言程序设计西华大学,知到C语言程序设计(西华大学)章节答案
  19. 在ROS上实现Seed robotics R8HD机械手与Ur5机械臂的连接与轨迹规划(上)模型连接
  20. java计算机毕业设计学生用品采购系统源码+数据库+系统+lw文档+部署

热门文章

  1. 框架流程图绘制工具OmniGraffle 7 for Mac
  2. latex参考文献中修改指定作者的格式来突出显示
  3. 仇【吐槽】生活和工作都一根筋的工友真心桑不起!真心快憋出内伤了!
  4. 学生DW静态网页设计——天津旅游(11页) HTML+CSS+JavaScript dreamweaver作业静态HTML网页设计模板
  5. Sublime Text正确的打开方式
  6. HI3559A系统卡死问题-修复
  7. react 前端实现打印发票/图片
  8. NLP实战:财经新闻热点发现
  9. 电脑浏览器收藏夹中的记录如何恢复?
  10. 介绍一个成功的 Git 分支模型——终于知道如何管理git分支了(好文章!!强烈建议看本文的英文原文)