作者:徐定德

来源:经管之家,欢迎转载,欢迎分享。

学习数据分析之spss分析工具,可真的不是一般的功夫,真的要很认真和很细心才能做得好spss。下面我来和大家分享一下关于SPSS数据分析心得小结,希望大家从这数据分析心得分享中能得到一些启示和指导。

心得 1

拿到一份数据,或者在看到国内外某个学者的文章有想法而自己手里的数据刚好符合这个想法可以做时,在整理好数据后不要急于建模。一定要对数据做缺失值处理、异常值处理。在数据预处理的基础上再进一步建模,否则可能得到错误的结果。

心得 2

承接心得1,数据预处理怎么做。一是缺失值的处理。我个人有几个看法:一是数据样本量足够大,在删除缺失值样本的情况下不影响估计总体情况,可考虑删除缺失值;二是数据样本量本身不大的情况下,可从以下两点考虑:1是采用缺失值替换,SPSS中具体操作为“转换”菜单下的“替换缺失值”功能,里面有5种替换的方法。若数据样本量不大,同质性比较强,可考虑总体均值替换方法,如数据来自不同的总体(如我做农户调研不同村的数据),可考虑以一个小总体的均值作为替换(如我以一个村的均值替换缺失值)。2是根据原始问卷结合客观实际自行推断估计一个缺失值的样本值,或者以一个类似家庭的值补充缺失值。

心得 3

承接心得1,数据预处理第二点异常值的处理。我大概学了两门统计软件SPSS和Stata,SPSS用的时间久些,熟悉一下,Stata最近才学,不是太熟。关于这点我结合着来说。关于异常值的处理可分为两点,一是怎么判定一个值是异常值,二是怎么去处理。判定异常值的方法我个人认为常用的有两点:1是描述性统计分析,看均值、标准差和最大最小值。一般情况下,若标准差远远大于均值,可粗略判定数据存在异常值。2是通过做指标的箱图判定,箱图上加“*”的个案即为异常个案。发现了异常值,接下来说怎么处理的问题。大概有三种方法:一是正偏态分布数据取对数处理。我做农户微观实证研究,很多时候得到的数据(如收入)都有很大的异常值,数据呈正偏态分布,这种我一般是取对数处理数据。若原始数据中还有0,取对数ln(0)没意义,我就取ln(x+1)处理;二是样本量足够大删除异常值样本;三是从stata里学到的,对数据做结尾或者缩尾处理。这里的结尾处理其实就是同第二个方法,在样本量足够大的情况下删除首尾1%-5%的样本。缩尾指的是人为改变异常值大小。如有一组数据,均值为50,存在几个异常值,都是500多(我这么说有点夸张,大概是这个意思),缩尾处理就是将这几个500多的数据人为改为均值+3标准差左右数据大小,如改为100。总结而言,我个人认为做数据变换的方式比较好,数据变换后再做图或描述性统计看数据分布情况,再剔除个别极端异常值。

心得 4

如何做好回归分析。经过多次实战,以及看了N多视频,上了N多课,看了N多专业的书。我个人总结做回归的步奏如下:1是承接心得1-3,对数据进行预处理,替换缺失值和处理异常值;2是将单个自变量分别与因变量做散点图和做回归,判定其趋势,并做好记录(尤其是系数正负号,要特别记录);3是自变量和因变量一起做相关系数,看各个变量相关关系强弱,为下一步检验多重共线性做准备;4是自变量多重共线性诊断。若变量存在多重共线性,可采用主成分回归,即先将存在多重共线性的变量做主成分分析合并为1个变量,然后再将合并成的新变量和其余自变量一起纳入模型做回归;5是做残差图,看残差图分布是否均匀(一般在+-3个单位之间均匀分布就比较好);6是报告相应结果。

心得 5

看到论坛上有网友问为什么他(她)老师不建议采用后向步进法处理变量多重共线性。记得张文彤老师说过他有个同学做过一个研究,即采用后向步进法剔除变量的方式去做回归,得到的结果犯错的几率比较大。张老师也不建议用这个方法处理多重共线性。处理多重共线性比较好的方法是做主成分回归。

心得 6

有个朋友问我在报到回归结果时用未标准化的回归系数好,还是用标准化后的回归系数好。我个人觉得这个问题仁者见仁智者见智,要看想表达什么。具体而言,如果想表达在其它条件不变的情况下,自变量X每变化1个单位,因变量变化多少个单位,这种情况用未标准化回归系数就好;如果想比较各个自变量对因变量影响的相对大小,即判断相对而言,哪个变量对因变量影响更大。这时需要消除量纲的影响,看标准化后的回归系数。

心得 7

这是投稿一篇SSCI外审专家提出的意见。我做的是无序多分类logistic回归模型。因变量分了5类,有一类个数比较多,达到300多,有1-2类个案比较少,只有30左右。专家提到了要做稳健性检验。这个用stata软件编程加一个robust即可解决问题。不知道在SPSS里面怎么做。欢迎知道的朋友一起讨论下。我个人认为这是一个好问题的。不做稳健性检验模型可能受一些极端值的影响,结果不稳定。可能本来显著的变量剔除1-2个样本后就变得不显著了。所以做回归分析稳健性检验也比较重要。

P.S.

如果有可能,我希望在后面的心得中附上实际操作的步奏图和解释的。看看有没有人需要这个。不然可能说的一些东西需要的人能看明白,但还是不清楚怎么做。希望和大家一起交流学习。

回归分析什么时候取对数_技术派|SPSS数据分析心得小结及心得分享!必备收藏...相关推荐

  1. 回归分析什么时候取对数_在线性回归中,什么时候使用自变量的对数代替实际值合适?...

    我总是告诉学生,采用自然对数来转换变量的三个原因.记录变量的原因将决定您是要记录独立变量还是因变量或两者.为了清楚起见,我正在谈论采用自然对数. 首先,如其他海报所指出的那样,提高模型拟合度.例如,如 ...

  2. 回归分析什么时候取对数_冬蜜什么时候取,冬天取蜂蜜的方法

    大家好,我现在分享的是,在冬天是在什么时候取蜜! 冬天在我们南方,取蜜时间是十一月到十二月的时候, 只要温度达到15度以上,蜂蜜封盖了就可以取蜜了, 并且在冬天我们只能取一次,最晚取蜜的时间在十二月的 ...

  3. python 怎么取对数_概率矩阵分解(PMF)及MovieLens上的Python代码

    首先对Probabilistic Matrix Factorization这篇论文的核心公式进行讲解和推导:然后用Python代码在Movielens数据集上进行测试实验. 一. 背景知识 文中作者提 ...

  4. MySQL8.0 物理克隆接口_技术实战 MySQL 8.0.17 克隆插件分享-爱可生

    原标题:技术实战 MySQL 8.0.17 克隆插件分享-爱可生 背景 很神奇,5.7.17 和 8.0.17,连续两个17小版本都让人眼前一亮.前者加入了组复制(Group Replication) ...

  5. spss多元非线性曲线拟合_快速掌握SPSS数据分析

    在和SPSSAU的用户交流中,我们发现本是非常简单的数据分析原理以及软件工具,结果非常多的同学完全不会SPSS数据分析,不知道如何学习,即使学过相关原理,但对具体数据进行分析时也有非常多问题. 这不禁 ...

  6. python 怎么取对数_重新开始学习Python 第二十八天 Python 数学模块

    Python数学模块 在程序开发的时候,可能不仅仅需要加减乘除这样的简单运算,还需要乘方.开方.取绝对值等等这样的复杂运算.这一篇文章将要介绍Python的数学内置模块math,这个内置模块能够解决常 ...

  7. python数组取对数_关于python:取列的对数

    我对编程非常陌生(在python中),我想创建一个新变量,该变量是列的对数(来自导入的excel文件). 我尝试过从该站点尝试不同的解决方案,但始终出现错误. 我最新的错误是AttributeErro ...

  8. wordpress漏洞_技术派 | 漏洞分析:WordPress 5.0 RCE(CVE-2019-6977)

    此漏洞通过路径遍历和本地文件包含漏洞的组合实现WorePress核心中的远程代码执行,据漏洞发布者ripstech透露,此漏洞已在WordPress核心中存在6年以上. 权限需求 author及以上权 ...

  9. 如何用java取对数_使用Java中的Math.log获取自然对数值

    要获取数字的自然对数,我们使用java.lang.Math.log()方法.Math.log()方法返回自然对数,即log以double值的底数e为底.如果传递的值为NaN或负数,则结果为NaN.如果 ...

最新文章

  1. DataGrid 的 全选/取消全选 控制(CheckBox)
  2. 理解JavaScript面向对象的思路
  3. Gitee X Serverless Devs 邀你来“领赏”啦!
  4. matlab 规范,matlab-代码-规范
  5. php需要掌握什么,php专业需要掌握哪些知识
  6. linux shell中实现循环日期的实例代码
  7. gcc和vc的两点区别
  8. 中美两国10万级作业调度工具 “TaskCtl“ Vs “Control-M“ 到底该如何选用?
  9. 试玩网站搭建讲解入门篇
  10. ip地址合不合法怎么看_怎样判断IP地址的非法性?
  11. C/C++在Java、Android和Objective-C三大平台下实现混合编程
  12. python xlrd读取文件报错_python利用xlrd读取excel文件始终报错原因
  13. 【小程序自动化Minium】二、元素定位-Page接口中的 get_element() 与 get_elements()
  14. Ant Design of Vue - 让 Message 组件支持手动点击关闭
  15. Android Adapter接口的实现类总结
  16. 《信号与系统》奥本海姆第二版中文版勘误
  17. 跑步消耗的能量按跑步距离算,对于平地跑步,热量计算的大致公式为:消耗热量(卡路里)=体重(公斤)*距离(公里),卡路里是能量单位,其定义为在1个大气压下,将1克水提升1摄氏度所需要的热量
  18. 旧文重发 | 爬虫工程师必须知道的几个法律案例
  19. IMAX中国创历史最佳十月纪录;强生、施华洛世奇将再亮相进博会;全球最大最高摩天轮迎来首批游客 | 美通社头条...
  20. clair、anchore、trivy开源数据库的数据来源分析

热门文章

  1. PulseAudio VS AudioFlinger(七)
  2. Android4.4 Input 输入上层分析
  3. VS2003编译winSDK7.1中的DirectShow
  4. Centos安装Clion
  5. Vue之脚手架第一个项目
  6. 巩固——Vue中proxyTable代理接口的配置
  7. elementUI 分页器使用时遇到的Bug
  8. linux软连接目标不存在,Linux ln创建软连接之后无法使用,无法whereis
  9. 恭喜宿主获得鸿蒙,第四十章大殿讲道,十连抽获得鸿蒙至宝!
  10. android socket第三方库,OkSocket 一个Android轻量级Socket通讯框架