因子分析是什么

因子分析定义

  因子分析就是在尽可能不损失信息或少损失信息的情况下,将多个变量减少为少数的几个潜在因子,这几个因子可以高度地概括多个变量的信息,是一种将多变量进行化简的技术。这一过程也叫降维。

因子分析相关概念

  (1) 因子载荷:因子载荷就是每个原始变量和每个因子之间的相关系数,它反映了变量对因子的重要性。

  (2) 公因子方差(变量共同度):就是每个变量所包含的信息能够被因子所解释的程度。所有变量的共同度在60%以上,可以认为所提取的因子对各变量的解释能力可以接受。

  (3) 因子旋转:因子结果的分析需要每个因子都要有实际意义,在原始变量和因子之间的相关系数可能无法明显的表示出因子的含义,可以对因子载荷矩阵进行旋转。(当有多个因子的时候,因子载荷将构成一个矩阵,成为因子载荷矩阵)

  (4) 因子得分:用来评价每个案例在每个因子上的分值,可以用于代替原始变量进行其他统计分析,也可以看成是降维之后的结果。

  (5) 最大方差法:能够使每个变量尽可能在一个因子上有较高载荷,在其余因子的载荷较小。

  (6) KMO和巴特利特检验:使用KMO取样适切性量数(KMO检验统计量)对比变量间简单相关系数和遍相关系数的指标。Kaiser给出的KMO度量标准:0.5以下表示极不适合;0.6表示不太适合;0.7表示一般;0.8表示适合;0.9以上表示非常合适。

  (7) 总方差解释:通过分析所提取的因子数量,以及所提取的因子对变量的累积方差贡献值。累计方差贡献值达到60%及以上,因子对变量的解释能力可接受;达到80%及以上,说明因子对变量的解释能力极好。

  (8) 碎石图:辅助我们判断最佳因子的个数,通常是选取曲线中最大斜率位置的因子。

  (9) 成分矩阵:又叫“因子载荷矩阵”,是各个原始变量的因子表达式的系数,显示提取的因子对原始变量的贡献值。

  (10) 旋转后的成分矩阵:通过因子载荷系数值分析出每个因子与各个变量之间的对应关系,对不合理变量进行删减。荷载值都小于0.4(建议值),则考虑删除或修改该变量;荷载值大于0.4,认为该变量与这个成分有对应关系。

  (11) 成分转换矩阵:显示的是旋转之前的因子载荷矩阵,有些变量在各个因子上的荷载比较接近,难以对因子进行明确的定义,因此不是很有参考价值。

  (12) 综合评价:因子1的贡献率/总贡献率FAC1_1+因子2的贡献率/总贡献率FAC2_1由高到低降序排列,即可找出优异。

为什么


怎样做


| 排版及指导: B y u n
| 撰稿:LC LN ZWT

数据分析学习笔记:因子分析相关推荐

  1. 数据分析学习笔记——数据可视化

    数据分析学习笔记系列--数据可视化 总第45篇 ▼ 写在前面: 本篇来源于书籍<数据之美-一本书学会可视化设计>的学习后整理所得.全篇主要围绕数据可视化的5个步骤展开,其中重点内容是第三步 ...

  2. Python数据分析学习笔记:使用SciKit-Learn进行数据规范化

    Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作.不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果 ...

  3. Python数据分析学习笔记:计算向量夹角

    Python数据分析学习笔记:计算向量夹角 通过计算两个向量夹角了解两个向量之间的相关性. # 计算向量夹角import numpy as npdef included_angle(a, b):a_n ...

  4. Python数据分析学习笔记:计算相关系数

    Python数据分析学习笔记:计算相关系数 1.相关系数概念 相关系数,或称线性相关系数.皮氏积矩相关系数(Pearson product-moment correlation coefficient ...

  5. Python数据分析学习笔记05:用户画像

    Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...

  6. python客户画像_Python数据分析学习笔记05:用户画像

    Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...

  7. 数据分析学习笔记-数据分析预备知识

    数据分析学习笔记 数据分析预备知识

  8. 数据分析学习笔记(二)数据分析三思维七技巧

    数据分析学习笔记(二) What 三种核心思维 结构化 公式化 业务化 Why 数据分析的思维技巧 象限法 多维法 假设法 指数法 二八法 对比法 漏斗法 总结 How 如何在业余时间锻炼分析能力 好 ...

  9. 大数据分析学习笔记(Z检验,分类器以及Association Rule)

    大数据分析学习笔记(Z检验,分类器以及Association Rule) Task 1 – Hypothesis Testing To improve student learning perform ...

  10. 数据分析学习笔记(四)Excel

    数据分析学习笔记(四)Excel 为什么要学习Excel Excel的学习路径1 Excel的必知必会 Excel的常见函数 什么是函数 常见函数 文本清洗函数 关联匹配函数 逻辑运算函数 计算统计函 ...

最新文章

  1. 1、使用库函数计算两个向量的夹角
  2. 使用Docker实现丝般顺滑的持续集成
  3. Python入门100题 | 第002题
  4. linux deepin sudo: add-apt-repository:找不到命令 解决办法
  5. jquery实现截取pc图片_如何优雅的对网页截取长图
  6. jersey客户端_每个客户使用Jersey处理的Cookie
  7. HadoopHA集群搭建
  8. BootstrapTable组件冻结列
  9. win7 64 位用VMware安装Ubantu 20130908
  10. java异步处理_Java编程开发好入门吗 消息队列的用途有哪些
  11. 如何优雅的使用fbx sdk
  12. 谷歌Gmail诞生记:十年回首
  13. IO流 (五) ----- 对象数据的序列化与反序列化
  14. jquery 插件开发小组
  15. OC基础知识(面试必看)
  16. Laravel—Purifier扩展包防止XSS攻击
  17. Latex 字母上面加符号 波浪线 横线 角号等
  18. iOS App更换图标Logo(本地更换)
  19. 4.9抽奖 | 实验室攻防平台邀请码
  20. 微信小程序开发中遇到的问题(前台用表格形式显示数据)

热门文章

  1. 【STM32学习5】STM32使用printf函数 打印到电脑串口助手
  2. 深度学习--生成式对抗网络--DCGAN/WGAN/WGAN-GP/LSGAN/BEGAN算法理论
  3. BigDecimal的使用和一些坑
  4. matlab解方程出现root,如何获得数值解
  5. java接口超时设置_java接口请求超时处理方法
  6. c#拷贝datatable行_C# DataTable使用方法详解
  7. 低密度SLC NAND闪存市场现状研究分析与发展前景预测报告
  8. springboot jar包瘦身
  9. 数据治理与元数据管理
  10. 线程池的getActiveCount()不准确问题