小数据 → y:连续性变量 → x:6个以内 → 理论 → 验证 → 统计分析;

大数据 → y:分类变量 → x:15个以内 → 探索 → 数据挖掘;

一、X的选择流程

  1. 业务(业务专家):运营报告 → 年度报/季度报 总是提到的字段 → 非常重要的变量;
  2. 相关:求xi与y相关系数 → 降序排序 → 底部30%删除 → 非常不重要的变量;
  3. 共线性:求x与x之间的相关系数 → 删除相关性较高的变量 → 比较重要的变量;
  4. 建回归:分部门建立y与x回归(运营报告页数决定部门重要性) → 每个部分删除50% → 比较不重要的变量;
  5. 主成分分析:一般控制6个以内(主要针对比较不重要的变量);

老年人和未成年人电商不分析 → 主要是促销活动容易触发法律;

电商领域很多指标都是反推出来的;

二、SPSS操作过程

第一步:

实用程序 → 定义变量集 → 第一步                实用程序 → 使用变量集 → 第一步

第二步:

分析 → 相关 → 双变量

SPSS 特征筛选、主成分回归相关推荐

  1. R语言主成分回归(PCR)、 多元线性回归特征降维分析光谱数据和汽车油耗、性能数据...

    原文链接:http://tecdat.cn/?p=24152 什么是PCR?(PCR = PCA + MLR)(点击文末"阅读原文"获取完整代码数据). • PCR是处理许多 x ...

  2. 机器学习——数据的共线性问题(岭回归、LASSO回归、逐步回归、主成分回归)

    一.如何检验共线性 容忍度(Trlerance):容忍度是每个自变量作为因变量对其他自变量进行回归建模时得到的残差比例,大小用1减得到的决定系数来表示.容忍度的值介于0和1之间,如果值越小,说明这个自 ...

  3. 主成分回归之后预测_主成分回归解析.ppt

    教学课件课件PPT医学培训课件教育资源教材讲义 主成分回归分析 一.主成分估计 主成分估计是以P个主成分中的前q个贡献大的主成分为自变量建立回归方程,估计参数的一种方法. 它可以消除变量间的多重共线性 ...

  4. Python数据分析案例22——财经新闻可信度分析(线性回归,主成分回归,随机森林回归)

    本次案例还是适合人文社科领域,金融或者新闻专业.本科生做线性回归和主成分回归就够了,研究生还可以加随机森林回归,其方法足够人文社科领域的硕士毕业论文了. 案例背景 有八个自变量,['微博平台可信度', ...

  5. 影像组学视频学习笔记(6)-特征筛选之LASSO回归(理论)、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(6)主要介绍: 特征筛选之LASSO回归分析(理论通俗讲解) LASSO (Least Absolute Shrinkage Selec ...

  6. R语言之主成分回归与偏最小二乘xt8.3xt8.4

    第8章 主成分回归与偏最小二乘 8.3 对例5.5的Hald水泥问题用主成分回归方法建立模型,并与其他方法的结果进行比较. 8.4 对例5.5的Hald水泥问题用偏最小二乘方法建立模型,并与其他方法的 ...

  7. 主成分回归之后预测_回归分析|笔记整理(B)——主成分回归(下),偏最小二乘回归...

    大家好! 上一节我们给主成分回归开了一个头,这一节我们会继续介绍它的有关内容,并且同时会介绍另一种新的回归方法:偏最小二乘回归.这一节的理论性也比较强,主要关注了相关回归的理论上的性质与相关证明. 提 ...

  8. 基于R语言的主成分回归(PCR)与Lasso回归在水稻基因组预测中的对比(生信数基实验作业)

    基于R语言的主成分回归(PCR)与Lasso回归在水稻基因组预测中的对比 0 引言 全基因组选择是 21 世纪动植物育种的一种重要的选择策略,其核心就是全基因组预测,即基于分布在整个基因组上的多样性分 ...

  9. ESL3.5 学习笔记(主成分回归,偏最小二乘回归步骤详解)

    3.5 运用派生输入方向的方法 这是一篇有关<统计学习基础>,原书名The Elements of Statistical Learning的学习笔记,该书学习难度较高,有很棒的学者将其翻 ...

  10. 多元线性回归算法: 线性回归Linear Regression、岭回归Ridge regression、Lasso回归、主成分回归PCR、偏最小二乘PLS

    0. 问题描述 输入数据:X=(x1,x2,....,xm)\mathbf{X} = (x_1, x_2,...., x_m)X=(x1​,x2​,....,xm​), 相应标签 Y=(y1,y2,. ...

最新文章

  1. 一文详解手眼标定之九点法
  2. 我的名片能运行Linux和Python,还能玩2048小游戏,成本只要20元
  3. 【tensorflow】重置/清除计算图
  4. 【杂谈】有三AI-CV春季划有用吗,听听他们的分享
  5. PowerDNS + PowerDNS-Admin
  6. java 调度quartz,java quartz任务调度
  7. unity导入素材时材质丢失素材变成粉红色的解决方法
  8. 利用dropbox来Host你的silverlight应用
  9. 《那些年啊,那些事——一个程序员的奋斗史》——06
  10. SPSS反向题处理(图文+数据集)【SPSS 011期】
  11. Ansys19.2安装及简单使用教程
  12. Python实现人脸识别
  13. python做生词本_Kindle 阅读器“生词本”功能详细使用说明
  14. java怎么获取本机的ip地址_java如何获取本机IP
  15. 解决IE浏览器无法删除证书的问题
  16. Python 基础部分(三)
  17. mac使用mysql出现的错误 ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)
  18. 是什么门的缩写_开车:和她结婚需要注意什么
  19. 操作系统 - - 生产者—消费者问题(PV操作)代码显示
  20. 从程序员到架构师的转型思维的转变 NLP思维利器(二)

热门文章

  1. 绘图工具 Gliffy 使用简介
  2. 3D贴图绘制软件Substance 3D Painter 2022中文版
  3. python 和vba在财务上_Excel函数和VBA技术在财务工作中的应用
  4. sql按照字符串格式拼接
  5. 一个苹果证书怎么多次使用——导出p12文件
  6. C# 怎么生成DLL文件(转)
  7. 小程序实现简单语音聊天
  8. 第9章 项目-房屋出租系统
  9. zend studio html乱码,zend studio出现乱码如何解决
  10. opencv-python中文文档