首先要说一下,这篇文章我在其他的平台发过,也是本人亲自写的,如果大家觉得眼熟的话放弃轻松,没有抄袭,主要是因为与我这 “葡萄酒的评价” 题目成系列了,因此在这里再把这个贴出来。


2012 年 A 题葡萄酒的评价,关于评价指标体系的构建,由于变量过多可以使用主成分分析法,对变量进行“降维”处理,使得分析计算结果得到简化。大家今天先学习方法吧,各种方法介绍全了会专门有一篇讲解这些方法在葡萄酒评价题目中的使用。

1

主成分分析法原理

主成分分析法:核心思想是根据原始数据的 n 个变量,重新组合成k个变量,而且这 k 个变量能最大程度的涵盖原始数据的信息。

依据:某一维的方差越大,其所包含的信息越多,也就是说越重要。转换坐标系的方法,可以将二维数据降为一维数据,将三维数据降为二维数据。

主成分分析法,可以通过线性变换的方法将多个变量组合成几个少数的重要变量的多元统计方法。在数学上,这种思想是“降维”。简单的描述一下计算的过程,假设现在有 20 个变量,通过相关性计算,将 20 个变量通过线性表示的方法简化成 4 个新变量,而整理出的4个新变量包含了原来 20  个变量的大部分信息。这句话包含了两个比较重要的点。第一点是整理出出来的是 4 个新变量,也有可能是在 20 个变量中选择出 4 个比较重要的变量。第二点是包含了原变量的大部分信息。而后就可以使用这 4 个新变量进行打分评价,主成分分析法最重要的作用是用于评价。现在可能就会有这么一个问题,既然 20 个变量都有,为什么不直接使用 20 个量进行评价,而是将20个变量简化成了4个新变量。这里就涉及到表述信息的重复。最初的20个变量,可能是从研究主体上直接提取到20个原始数据,可能有两个量之间包含的信息重复,当然也有不同的信息之处。如果第20个变量所展现出来的信息完全可以由其他的19个变量线性表示,那第20个变量的存在完全是没有意义的。这就是在处理中简化变量个数的意义。

新的主成分与原始变量具有不可分割的联系,如下:

1、主成分保留了原始变量绝大多数信息。

2、主成分的个数大大少于原始变量的数目。

3、各个主成分之间互不相关。

4、每个主成分都是原始变量的线性组合。

然后给出一个应用的例子,美国统计学家stone研究国民经济的发展状况,他利用1929年—1938年的的数据得到了17个指标变量,包括雇主补贴,公共支出,利息等,通过主成分分析法,将17个变量简化成了三个新变量,依据自身经济学的背景知识,将三个每变量分别定名为:总收入,总收入变化量,经济发展趋势。这也是主成分分析法需要注意的一个问题,你需要根据背景知识将新变量进行重新命名,这个对于大部分人是很难做到的,也是一个使用受限的一个地方。

2

主成分分析的计算及特点

主成分分析的步骤:

1、初始变量

2、根据初始变量特性选择使用协方差矩阵还是相关矩阵求主成分。

3、计算协方差矩阵或相关矩阵的特征值和特征向量。

①解特征方程,常用雅可比法求出特征值,并使其按大小顺序排列

②分别求出对应于特征值的特征向量

③ 计算主成分贡献率及累计贡献率

④ 计算主成分载荷

⑤ 各主成分的得分

4、确定主成分个数

5、对主成分的含义做解释。

主成分分析的特点:

1、变量间需要有较强相关性,保证能起到很好的降维的效果。

2、新的指标体系无法包含原数据的所有信息。

3、计算前需要进行标准化处理,具体的含义会发生变化,自己进行指标命名时会发生较大的困难。

3

主成分分析的案例分析

一、从将Excel中的数据导入spss

1、启动spss软件

2、操作一下步骤

3、注意修改文件类型,找到你的文件

4、属性修改

5、完成导入

二、主成分分析步骤

1、如下操作,降维

2、将左侧的变量导入到右侧,修改“描述、提取、得分”三项

3、修改三项

#描述:

#提取,选中比较直观的碎石图

#得分,选中得分系数矩阵,并点击继续

4、回到初始的界面,点击确定,开始计算

三、计算结果的保存

1、右击,选择导出

2、命名,确定即可

3、在word里可以直接复制分析出来的了

4

主成分分析的计算结果分析

计算结果是很多的图表,这也是说这是个傻瓜软件的原因,通过操作得到这些图表的过程是很简单的,但是能把这些图表分析清楚需要你有一定的统计学的知识背景。原始数据如下:

1、相关系数矩阵

相关系数矩阵能表示任意两个指标之间的关系( spss 中,0.01,它只写个 .01),比如 GDP 跟 GDP 相关性,自身与自身的相关性是1了; GDP 与工业增加值相关性为 0.967 ,大于0.9的数,表示相关性程度已经非常强了。

2、总方差解释

总方差解释图表是主成分分析中最重要的一个表格。在这个案例分析汇总,主成分是两个,第一主成分占比重 72.205% (可以这么理解),第二主成分占比重 12.346% ,这两个主成分达到 85.551% ,超过了 80% ,可以说用这两个指标评价各省份的经济完全可以代替原来的10个指标。碎石图原理基本相同。

3、系数获取

系数指的是在获得两个主成分后,用 10 个原变量线性表示新的 2 个主变量的过程, spss 软件给出的“成分得分系数矩阵”中可以直接得到系数。

十个变量的位置大家摆清楚,通过以上表格得到这个线性表示的方程,但是大家一定要清楚,由新求出来的 2 个主成分表示总得分的时候一定记得,利用主成分各自占的比重重新求,而不是原来的简单的权重,从下边公式中看的比较清楚,直接看下边的图片吧。

4、计算得分

计算的得分过程也是有很多技巧的,有的人用计算器按,有的人用 Excel 计算,有的人直接拿 MATLAB 矩阵相乘,效率也不一样的,强烈建议大家使用 MATLAB 进行计算,矩阵相乘大家还记得吧,行向量乘以列向量等于位次相同的元素相乘再加和,跟上边这个公式计算过程一模一样,建议大家回去试一试。当然用 Excel 计算也是比较方便。

从结果上看,广东排名第一,江苏次之。但是天津作为直辖市排名第十,原因可以结合题目背景进行讨论,比如人口数量等因素。

大家先把这方法看明白,到最后的时候会综合的联系到 “葡萄酒评价” 一题上。

5

资源分享

本次主要有三个要分享的东西。

1、这次案例用到的原始数据。

2、用到的软件 spss 版本 24,今天的第二篇推文是 spss24 的安装教程。

3、我自己看过的 spss 的教程,简单易懂的那种。

链接:  https://pan.baidu.com/s/1YuGUnIqbampc8Ag6XV8lfg

提取码:  sv8f 复制这段内容后打开百度网盘手机App,操作更方便哦

撰文 / 科研狗Doggy

排版 / 科研狗Doggy

-数学与物理-原创内容  转载请联系后台

往期精彩回顾

———————————————

经验 | 数学建模中数据归一化处理
狗子荐题| 2012 年 建模国赛 A 题
软件 | MATLAB2014a软件及安装教程

————————————————————————

公众号ID:maths-physics*****************************************数学建模 || 物理学术竞赛

软件安装 || 资料大礼包

数学、物理的历史

认知、逻辑的提升

主成分分析法_数学建模 || 葡萄酒的评价(1)主成分分析法相关推荐

  1. LL1分析构造法_数学建模算法--最优赋权法(含代码)

    数学建模算法--最优赋权法(含代码) 作者:郑铿城 本次介绍数学建模和科研写作的方法--最优赋权法最优赋权法经常用于分析评价类问题,从该算法的名称就可以看到,该算法首先要体现"最优" ...

  2. 仅记录我的第一次数学建模——葡萄酒的评价

    仅以此来记录我的数学建模课小组作业 2022.11.3周四运动会放假,终于有时间做数学建模啦(月底就要答辩了,今日数学建模小组作业进度2.6666%, 2022.11.23哈哈哈哈哈哈终于写完了,但! ...

  3. 【数学建模】2012年全国大学生数学建模-葡萄酒的评价问题全面解析(附R语言实现部分代码)

    问题背景 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量. 完整代码详见 实战应用案例:葡萄酒评价( ...

  4. 数学建模第一讲:层次分析法

    数学建模第一讲:层次分析法 笔记大部分由观看[强烈推荐]清风:数学建模算法.编程和写作培训的视频课程整理出: 视频链接:https://www.bilibili.com/video/BV1DW411s ...

  5. 图书销量时间序列预测_数学建模_Prophet实现

    图书销量时间序列预测_数学建模_Prophet实现 前言 主要参考 代码 库导入与函数设置 导库 展示函数 取数据函数 训练函数 评估函数 数据预处理 数据集划分 数据分布查看 销售曲线查看 销售预测 ...

  6. 数学建模(12)——多元回归分析法

    数学建模(12)--多元回归分析法 1.多元回归分析法的含义: 多元回归分析其实就是,抓重点.比如有各种各样的变量x1.x2.x3.x4,,,,要看看跟y有什么关系,多元回归就是把跟y相关的留下,无关 ...

  7. 12年数学建模葡萄酒c语言,葡萄酒的评价问题—2012年全国大学生数学建模竞赛B题...

    2012年9月,我参加了"高教社杯"全国大学生数学建模竞赛,荣获国家二等奖(我们学校只有两支队伍获国家奖),这是一次难忘的经历,因为我从此爱上了数学建模,而建模的思想让我受用终身. ...

  8. 二维动态规划降维误差一般为多少_数学建模常用算法模型

    数学模型的分类 按模型的数学方法分: 几何模型.图论模型.微分方程模型.概率模型.最优控制模型.规划论模型.马氏链模型等 按模型的特征分: 静态模型和动态模型,确定性模型和随机模型,离散模型和连续性模 ...

  9. 数学建模笔记 Topsis和熵权法

    Topsis法(Technique for Order Preference by Similarity to Ideal Solution)可翻译为逼近理想解排序法,国内常简称为优劣解距离法. ​ ...

最新文章

  1. 19款绚丽实用的jQuery/CSS3侧边栏菜单
  2. 账号 linux_Linux入门之UID和GID(用户ID和组ID)
  3. LeetCode-动态规划基础题-343. 整数拆分
  4. 使用networkx来生成网络科学里面三种常见的网络
  5. 做形态学方法的团队_做好形态学实验教学准备工作的几点体会
  6. rrpp协议如何修改_RRPP协议做为高级网络工程师不能不懂的技术带你快速学习
  7. 图解微服务技术架构体系
  8. python客户端软件开发_用 Python 实现一个简易版 HTTP 客户端
  9. 1瓦功耗,5GHz频率:全球最快Risc-V芯片出世,效率超越苹果M1
  10. 05_家谱管理系统(小钱版)[数据结构][2012-02-03]
  11. 插件!最好用的翻译插件!!
  12. RFBnet论文翻译:感受野块网络对于精确的和快速的目标检测
  13. 北京工业大学 计算机学院分数线,2019年北京工业大学计算机专业录取分数线
  14. 计算机科学计算器CE符号,计算器的ce和c是什么意思???
  15. 付永刚计算机信息安全技术课后答案
  16. Bootstrap4 导航active状态切换
  17. word表格合并单元格后,光标居中
  18. 图像识别(二)| 图像的色彩空间
  19. 关于汉字转化为简码的方法
  20. 海思平台INA220电压电流模块调试

热门文章

  1. ASP.NET Core 集成 React SPA 应用
  2. Exceptionless服务端本地化部署
  3. 真正的高手,都有增长思维!(深度好文)
  4. C# 中的 ref 已经被放开,或许你已经不认识了
  5. 数据库单表千万行 LIKE 搜索优化手记
  6. 微软正式发布 gRPC-Web for .NET
  7. Steeltoe 2.4新增代码生成工具、全新入门指南等,助力.NET微服务开发
  8. .NET Core 3.0中用 Code-First 方式创建 gRPC 服务与客户端
  9. asp.net core 使用 signalR(一)
  10. .net core redis的全套操作