作者:丁点helper

来源:丁点帮你

前几天的文章,我们聚焦在回归分析,今天来看看在回归分析中常常要研究的一类难点问题——交互作用的探究。

交互(interaction),字面上不太好理解,但是从数学表达上却很简单。

如果想要研究两个自变量如X1和X2的交互作用,通常的做法就是将两个变量相乘,即X1*X2,然后把乘积项纳入到回归方程。

操作起来很简单,但交互项的纳入对于回归系数的解读却带来了新的问题。

以一个很经典的例子来说明。

含交互项的回归方程

多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。

我们想通过线性回归研究教育程度、性别对个人收入的影响,首先,不纳入交互项的回归方程为:

其中,Y表示收入,X1表示“教育年限”(定量变量),X2表示“性别”(分类变量,用”0“为女性;“1“表示男性)。

通过估计以上回归方程X1和X2的回归系数,β1和β2,即可定量地衡量出教育程度、性别对收入的影响。

比如,β1的含义即为:控制性别后,教育程度每增加一年,个人收入增加的量。

这是我们前面讲过的,很好理解。

现在,我们希望考虑”教育程度“和”性别“的交互作用,因此将把两个变量的交互项纳入回归方程,即为:

其中,X1X2代表交互项,这里也属于多重线性回归的范畴,因为我们可以令X3=X1X2,将其视为一个新变量,则上式就可以看做是拥有三个自变量的一般线性回归。

思考:现在方程中X1的回归系数β1还能按照上面的含义来解读吗?

我们尝试做一下。

要衡量X1对Y的作用,归根结底,是要看,当X1变化一个单位时,Y怎么变化(明白这一点很基础也很重要)。

因此,我们可以这样来做:

当X1=0时(代入有交互项的方程,下同),

由此,可以发现,加入交互项后,X1(即教育程度),每变化一个单位(比如增加一年),收入的变化不仅取决于β1,而且还取决于β3和X2。

因此,我们不能再直接将β1解读为教育程度对收入的影响。

同理,β2也不能直接解读为性别对收入的影响。

在这样的情况下,到底应该如何来对这三个回归系数进行解读呢?思路其实很简单,诀窍就是分别让X1和X2等于0。

由此来看,加入交互作用后,回归系数(β1和β2)的解读需要加入一定的限定条件,比如”教育程度为0“、或者特定为“女性人群“。

这实际上是出于简单的数学考虑:因为让一个变量等于0,我们就可以消除交互项,然后单独地分析另一个变量的效应,这种思路特别方便,大家不妨在自己的研究中使用。

说完β1和β2,那β3怎么解读呢?严格而言,β3才是真正交互项的系数,才是做交互研究最关注的部分。

交互项回归系数的解读

多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。

上面我们讲了β1的含义是”对于女性人群,教育程度每增加一年,其收入的增加量“。很自然的想,那对于男性人群,教育每增加一年,收入增加多少呢?

前面我们计算了,X1从0变化到1时,

我们知道,X2表示的是性别这个变量,X2=1代表男性,那如果我们直接把X2=1代入上式呢:

由此,我们就得到了:对于X2=1(即男性人群),当X1增加一个单位时,Y的变化量为(β1 + β3)。

因此,可以把(β1 + β3)解读为:对于男性人群,教育程度每增加一年,收入的增加量。

把男性和女性放在一起对照看一下:

β1:对于女性人群,教育程度每增加一年,其收入的增加量。

β1 + β3:对于男性人群,教育程度每增加一年,其收入的增加量。

现在,β3(即交互项的回归系数)的含义是不是一目了然。它表示,教育程度每增加一年时,男性和女性收入增加的差值。

代入具体的数字看起来会更容易。

比如,我们让β1 = 200;β2 = 300;β3 = 50,就可以很清楚地看到:

对于女性来讲,教育程度每增加一年,收入会增加200(β1 的含义);

对于男性来讲,教育程度每增加一年,收入会增加250(β1 + β3的含义)。

而β3就表示,同样增加一年的教育程度,收入的增加量,男性比女性多50。

这多出来的50就衡量了性别和教育的交互作用。

理清了这三个系数的意义,我们再来看交互作用的真正含义,就会更加明朗:

交互作用实际上影响的是一种关系,什么关系?X1和Y的关系,或者X2和Y的关系。

此话怎讲?我们看,当不加入交互项的时候,无论男性还是女性,教育程度增加一年,收入的增加量是一样的,都为β1。

这里的β1 可以视作教育程度对收入的影响,实际上是两者相关关系的量化。

但是,加入交互作用后,教育程度增加一年,收入的增加量,男性和女性就不一样了,一个是β1 + β3,另一个是β1。

不难发现,教育程度对收入的影响随着性别的变化发生了变化。

所以,从本质上看,交互项衡量的了性别对【教育程度与收入关系】的影响。用括号括起来就是希望大家能看的更清楚:性别和教育的交互项影响的既不是教育程度也不是收入,而是它们两者的关系。

如果数学基础不错,则可以将“【教育程度与收入关系】”理解为回归方程的X1(教育程度)的斜率(斜率的定义就是X1变化一个单位,对应的Y的变化量),所以,本质上,交互项影响的是斜率!

同样地,交互项因为是乘积的形式,所以它也衡量了教育程度对(性别与收入关系)的影响。

如何进行分析,做法其实完全一致,首先分别计算X2=0和X2=1时候,Y的变化量(代表了男女收入的差异):

我们知道X2表示性别,所以,根据上式,可以将β3解读为:教育程度的变化,带来的男女收入水平差异的变化,注意这里说的是”差异“,即男性工资高于女性的那一部分(如果β3是负数,则表示男性工资更低)。

因此,综合来看,交互项是可以从两个角度去理解和解读的,这符合它进入回归方程的方式(X1X2)。

针对具体的问题,我们都可以采取上面说的这种”归零法“去分析和拆解,即分别一个自变量等于0,然后分析另一个自变量回归系数的含义。

同时,专门对于交互项的解读,我们要知道它刻画的其实是对回归斜率或者回归效应值(β)的影响。

比如教育程度和性别的交互,既影响了收入对教育程度的斜率,也影响了收入对性别的斜率。

一文轻松看懂线性回归分析的交互作用!相关推荐

  1. python可视化数据分析交互作用_一文轻松看懂线性回归分析的交互作用!

    作者:丁点helper 来源:丁点帮你 前几天的文章,我们聚焦在回归分析,今天来看看在回归分析中常常要研究的一类难点问题--交互作用的探究. 交互(interaction),字面上不太好理解,但是从数 ...

  2. 刷新table数据_经典 - 一文轻松看懂数据透视表

    [导语]也许大多数人都知道 Excel 中的数据透视表,也体会到了它的强大功能,那么 Pandas 也提供了一个类似的功能,也就是pivot_table.因为考虑到直接学 pivot_table 会有 ...

  3. 什么是区块链?什么是比特币?一文轻松看懂!

    关于「区块链」,先看网上关于「区块链」的一组漫画.看完漫画秒懂! 大概的意思清楚了吧?! 再来看来源 IT之家 的一篇文章.以下是原文: 为什么最近区块链技术这么火?为什么如此多的科技公司都开始拥抱区 ...

  4. 如何看计算机cpu的好坏,cpu主要的性能参数有哪些、怎么看?教你几招轻松看懂CPU性能好坏...

    CPU是Central Processing Unit(中央处理器)的缩写,CPU的详细参数包括内核结构, 主频,外频,倍频,接口,缓存,多媒体指令集,制造工艺,电压,封装形式,整数单元和浮点单元等. ...

  5. 电路图符号超强科普,轻松看懂电路图!(推荐收藏)

    电子设备中有各种各样的图.能够说明它们工作原理的是电原理图,简称电路图. 电路图有两种,一种是说明模拟电子电路工作原理的.它用各种图形符号表示电阻器.电容器.开关.晶体管等实物,用线条把元器件和单元电 ...

  6. 各种CAD工程常用图例,如何轻松看懂图!

    这篇文章发表之前,感谢粉丝支持,小编热爱每一位粉丝!上一篇文章中有很多粉丝留言评论,有没有其他CAD工程图纸常用图例.代号大全,接下来就可以教大家一个非常好用的方法,找到你需要的常用工程图例,下载查看 ...

  7. 【转】超详细的UML状态图符号,初学者也能轻松看懂状态图

    UML状态图,用于显示状态机,即描述一个对象所处的可能状态以及状态之间的转移.用状态图建模可以帮助开发人员分析复杂对象的各种状态的转换,以及对象何时执行怎样的动作.那状态图又是怎样表示这些信息的呢?要 ...

  8. dwr框架查看外放方法_轻松看懂建筑图纸符号!这样简单高效的方法你一定要知道...

    视频学习教程推荐: [天正建筑CAD2020教程]点击查看 [天正暖通CAD2020教程]点击查看 [天正电气CAD2020教程]点击查看 [天正给排水CAD2020教程]点击查看 [园林景观设计教程 ...

  9. 一文轻松搞懂LCD驱动编写

    开发环境: 开发板:JZ2440V3 CPU:samsunS3C2440 内核:Linux3.4.2 编译工具:arm-linux-gcc 4.3.2 LCD:4.3存液晶屏AT043TN24 参考文 ...

最新文章

  1. 什么是好的图神经网络?
  2. 外媒列举2011年十大IT预测:鲍尔默卸任微软CEO
  3. Docker学习与和应用(二)_使用Docker
  4. cs4 php,php dreamweaver cs4
  5. 将函数当做参数 matlab,Matlab中如何将(自定义)函数作为参数传递给另一个函数...
  6. [前台]---js中去掉双引号或者单引号
  7. luogu P4070 [SDOI2016]生成魔咒
  8. 基于python的空域变换
  9. Centos7 操作系统 mysql5.7 配置远程登陆操作
  10. 你知道怎么离线安装全局 node 模块吗?
  11. android学习日记20--连接组件之Intent和IntentFilter
  12. [导入]DataTable的排序、检索、合并
  13. java 编程英语单词,语句
  14. MyBatis 缓存原理梳理
  15. 基于FPGA板的音乐盒的设计
  16. 【脚本】get_pixel(用PIL中自带的getpixel,得到单张图像或者某个文件夹中所有图像的P模式index)
  17. AI上推荐 之 SDM模型(建模用户长短期兴趣的Match模型)
  18. ATW热泵市场现状及未来发展趋势分析
  19. 北上或者南下之被摆了一道
  20. ROS Couldn‘t find executable named xxx.py问题

热门文章

  1. GNSS 各种组合简介及推导
  2. es文件浏览器 正在增加服务器,es文件浏览器出现错误,es文件浏览器无法找到服务器怎么解决?...
  3. 实现对rtp H264码流的组帧
  4. tomcat清除缓存的几种解决方式
  5. 【01 DualCam Porting】
  6. 复制目录及目录下的所有文件的批处理_国庆放假你加班?1分钟新建1000个文件夹,有此技能保证不加班...
  7. java 计算星座_java 根据生日计算星座
  8. 小红书2020校招前端笔试题卷一
  9. 全景丨0基础学习VR全景制作,平台篇第13章:热点功能-总览介绍
  10. QCC---配置文件中标签(tag)参考说明