数据分析的 5 种归纳方法
公众号后台回复“图书“,了解更多号主新书内容
作者:林骥
来源:林骥
下面介绍 5 种归纳方法,即:求同法、求异法、共用法、共变法和剩余法,其实这些方法早在古代就有,后来培根在《新工具》一书中进行了概括和归纳,最后由穆勒加以系统的整理和说明,因此通常称为「穆勒五法」。
1. 求同法
在多个场合中,如果只有一个条件相同,那么这个相同的条件,就是我们要找的原因。
用字母来表示,如果有 A 就有 a,那么 A 可能是 a 的原因。
场合 | 情况 | 被研究现象 |
---|---|---|
(1) | A、B、C | a |
(2) | A、D、E | a |
(3) | A、F、G | a |
…… | …… | …… |
比如说,火鸡吃了「发霉的花生」,得癌症死了,鸽子、老鼠、鱼等动物吃了这种花生,也都得癌症死了。
在这个例子中,只有「发霉的花生」这个条件是相同的,其中「发霉的花生」是 A,「得癌症死亡」就是 a,于是猜想,吃发霉的花生是得癌症死亡的原因。
后来,通过化验证明,在发霉的花生中,有一种黄曲霉素,这是一种致癌的物质。
再比如,有一组患 a 病的人,他们年龄不同,身高不同,性别不同,饮食习惯等等都不同。他们只有一个共同点,就是都酗酒。利用求同法,酗酒和 a 病之间可能存在因果关系。
求同法相对比较简单,但是要注意它的局限性,不要把巧合当成因果。
2. 求异法
如果一个现象是否出现,只有一个条件不同,那么这个不同的条件,就是我们要找的原因。
用字母来表示,如果有 A 就有 a,且无 A 就无 a,那么 A 可能是 a 的原因。
场合 | 情况 | 被研究现象 |
---|---|---|
(1) | A、B、C | a |
(2) | 一、B、C | 一 |
…… | …… | …… |
比如说,在化学实验中,氯化钾加热会产生氧气,但速度很慢,当加入少量「二氧化锰」之后,产生氧气的速度明显加快。
在这个例子中,「二氧化锰」是影响速度快慢的唯一不同条件,其中「二氧化锰」是 A,「快速产生氧气」是 a,所以,二氧化锰是快速产生氧气原因。
再比如,中国人和外国人远洋航行,途中,外国人都得了坏血病,中国人都没事。用求异法发现,中国人喜欢喝茶,这一点与外国人不同,其中「喝茶」是 A,「抵御坏血病」是 a,于是归纳出「喝茶能够抵御坏血病」的猜想。
在现实的业务环境中,很难找到只有一个条件不同的场景,所以,一般要借助 AB 测试,控制好实验组与对照组的唯一不同条件,让其他条件都尽可能保持一致。比如投放两组广告,只有标题不同,其他都一样,然后分析转化率的差异。
3. 共用法
共用法,就是把求同法和求异法结合起来共同使用,从而让分析结论更加可靠,但并不能保证结论完全正确。
具体来说,共用法包括两次求同和一次求异,即以下三个步骤:
第一步:正面场合求同,寻找现象出现的相同条件,有 A 就有 a;
第二步:反面场合求同,寻找现象不出现的相同条件,无 A 就无 a;
第三步:正反场合求异,得出数据分析的结论,A 可能是 a 的原因。
场合 | 情况 | 被研究现象 |
---|---|---|
(正面场合1) | A、B、C | a |
(正面场合2) | A、D、E | a |
(正面场合3) | A、F、G | a |
…… | …… | …… |
(反面场合1) | 一、B、C | 一 |
(反面场合2) | 一、D、E | 一 |
(反面场合3) | 一、F、G | 一 |
…… | …… | …… |
比如说,有阳光,韭菜等植物是绿色,没有阳光,韭菜等植物不是绿色,其中「阳光」是 A,「绿色」是 a,所以阳光可能是韭菜等植物变成绿色的原因。
再比如,为了调查甲状腺肿大的原因,先到几个这种病流行的地区,发现这些地区的地理环境、经济水平都各不相同,但有一点是相同的,即居民经常食用的食物和饮用的水中缺碘。再到一些这种病不流行的地区去调查,发现这些地区的地理环境和经济水平也各不相同,但有一点是相同的,即居民经常食用的食物和饮用的水中不缺碘。其中「缺碘」是 A,「甲状腺肿大」是 a,所以缺碘可能导致甲状腺肿大。
再举一个商业环境中的例子,对广告效果进行数据分析的时候,假如广告文案中包含「限时」的转化率就较高,不包含「限时」的转化率就不高,那么我们可以认为,「限时」这个关键词对转化率可能有提升效果。
在实际工作中,共用法比求同法和求异法的应用更加广泛,得出的结论往往也更加可靠。
4. 共变法
在其他条件不变的情况下,如果某一现象发生变化,另一现象也发生变化,那么这两个现象之间可能存在因果联系。
用字母来表示,如果 A 变化的时候 a 也变化,那么 A 可能是 a 的原因。
场合 | 情况 | 被研究现象 |
---|---|---|
(1) | A1、B、C | a1 |
(2) | A2、B、C | a2 |
(3) | A3、B、C | a3 |
…… | …… | …… |
比如说,气温上升,水银体积就膨胀;气温下降,水银体积就缩小,其中「气温」是 A,「水银体积」是 a,气温与水银体积之间可能存在因果关系。
再比如,广告投放量增加,销量就上升,广告投放量减少,销量就下降,其中「广告投放量」是 A,「销量」是 a,广告投放量与销量之间存在因果联系。
使用共变法时要注意,不能仅凭简单观察,就确定因果关系。有时两种现象共变,但实际上并无因果联系,比如闪电与雷鸣。
5. 剩余法
已知复合结果是由复合原因引起的,如果其中一部分原因导致一部分结果,那么剩余部分原因也会导致剩余部分结果。
用字母来表示,如果 A、B、C、D 导致 a、b、c、d,其中 A、B、C 分别导致 a、b、c,那么 D 可能导致 d。
场合 | 情况 | 被研究现象 |
---|---|---|
(1) | A、B、C、D | a、b、c、d |
(2) | A | a |
(3) | B | b |
(4) | C | c |
比如说,天王星的运行轨道,有四个地方发生偏离,其中三个地方的偏离是由三个行星引起的,所以天文学家和数学家认为,第四个地方的偏离肯定是因为受到另一个行星的引力。其中三个行星分别是 A、B、C,三个地方的偏离分别是 a、b、c,第四个地方的偏离是 d,而另一个行星就是要找的 D。
后来果然发现了这个行星,它就是海王星,是唯一利用数学预测发现的行星。
一般来说,剩余法只能用于研究复合现象的原因。
小结
以上介绍的 5 种归纳方法,即:求同法、求异法、共用法、共变法、剩余法,是我们获取新知的重要方法。需要注意的是,它们都属于不完全归纳法,也就是说,即使推理过程看起来没问题,但是得出的结论可能是错误的,应该经过进一步的验证。
有许多的案例和故事都说明,有限的观察不等于真理。
比如说,中国的天鹅是白色的,美国的天鹅也是白色的,于是有人猜想,所有天鹅都是白色的。但是,世界上确实有黑天鹅存在。
再比如,在《三体》中有这么一个故事:
一个农场里有一群火鸡,农场主每天中午十一点来喂食。火鸡中有位科学家,观察了近一年都没有例外,于是它发现了自己宇宙中的伟大定律:「每天上午十一点,会有食物降临。」它在感恩节的早晨,向火鸡们公布了这个定律,但这天上午十一点,食物没有降临,农场主进来把它们都捉去杀了。
为了避免以偏概全,我们需要运用合适的方法,加强归纳思维的训练,积累更多实战的经验,这样归纳总结出来的结论,才能经得起时间的考验,才会更有现实意义。
◆ ◆ ◆ ◆ ◆
麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行400-240活动,大家可以用相当于原价4折的预购价格购买,还是非常划算的,扫描下方小程序即可进入购买页面:
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。管理员二维码:猜你喜欢● 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗
数据分析的 5 种归纳方法相关推荐
- 异常数据4种剔除方法_数据分析系列 22/32 | 9种常用的数据分析方法
要使各种结构化的.非结构化的.海量的数据实现标准化.信息化,能够提供业务绩效评估.业务决策支持等要求,我们首先需要进行数据分析. 同时,围绕业务问题,采用合适的分析方法,分析模型,以及分析工具,这是数 ...
- 大数据可视化python_大数据分析之Python数据可视化的四种简易方法
本篇文章探讨了大数据分析之Python数据可视化的四种简易方法,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入. < 数据可视化是任何数据科学或机器学习项目的一个重要组成部分 ...
- 数据分析常用三种方法
数据分析常用三种方法:趋势分析.对比分析.细分分析 1. 趋势分析 趋势分析般而言,适用于产品核心指标的长期跟踪,比如,点击率,GMV,活跃用户数等.做出简单的数据趋势图,并不算是趋势分析,趋势分析更 ...
- [数据分析干货]四种简单常用的数据分析方法,学完立马升职加薪!
你是否做了N个渠道推广,却不知道钱花的效果怎么样? 你是否用数据做了很多图表,但是只知道表象却不会深入分析现象背后发生了什么,得不出什么有效的结论? 今天就来给大家分享4种最常用的数据分析方法,让你在 ...
- 数据分析的 8 种思维
总结了 8 种数据分析的思维,并用一些小故事进行举例说明. 对比思维 在我们日常的工作和生活中,对比思维其实是随处可见的. 比如说,小明某次期末考试的成绩不好,英语只得了 30 分,小明的妈妈对他说: ...
- 【天光学术】MBA论文常用的七种研究方法,你会哪几种?
MBA学位论文属于务实.实证或案例研究类型的论文,目的在于要求MBA学员将所学的管理理论知识运用于企业管理的实践,考核学员提出问题.分析问题.解决问题的能力.MBA学位论文强调实用性和整合性,一方面, ...
- 数据驱动的种萝卜方法
从前有一群小白兔,他们辛勤的种萝卜.有一天他们发现他们种的萝卜不是太少无法满足兔子们的需求,要不就是太多放在仓库里面烂掉了:萝卜的质量也是参差不齐的,小白兔们需要的是好吃的萝卜,但有些萝卜种出来后就是 ...
- python 生成001开始的序号_你知道嘛:Python内建序列通用操作有6种实现方法(赶快收藏)...
本文内容主要介绍了Python内建序列通用操作6种实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下!!! 数据结构式通过某种方式(例如对元素进 ...
- 数学猜想验证步骤_高中数学解题思路与技巧汇总,19种解题方法,实用!
解数学题,除了掌握有关的数学知识之外,最好掌握一定的解题技巧甚至知道点解题思想.要知道高考试题的解答过程中蕴含着重要的数学思想方法,如果能有意识地在解题过程中加以运用,势必会取得很好的效用.下面邦德华 ...
- 软件测试三种错误的是,软件测试中的三种排错方法(知识篇)
1.排错过程 测试用例的执行是排错过程的开始,若测试结果与期望结果有出入,即出现了错误征兆,排错过程首先要找出错误原因,然后对错误进行修正.因此排错过程有两种可能,一是找到了错误原因并纠正了错误,另一 ...
最新文章
- 得到一个数组里面相同元素的个数
- java内存泄露分析方案
- 1.12 Java数组使用binarySearch()方法查找指定元素
- php开发领域,PHP-MySQL相关领域
- python画父子关系图_将有父子关系的一维数组转换成树形结构(多维)数据
- 一些社会运行的底层规律,和你的利益息息相关
- sqlserver的存储过程
- [Andriod设计模式之旅]——Builder模式
- 使用Flash,HTML5和Unity开发网页游戏的对比
- PMP干货教你一秒选对PMP考试答案!
- DM368开发 -- 再论 UBL
- 如何用MATLAB求解一元高次方程
- 自建网站教程!如何用云服务器搭建个人网站?
- AI训练环境-CUDA/cuDNN/paddle ——‘CUBLAS_STATUS_INVALID_VALUE‘.
- 易基因|Science:单细胞甲基化测序鉴定哺乳动物的新神经元亚型和调节元件
- 随机过程(一)基础概念与随机过程基本类型
- 行业洞察丨小微企业信息化管理痛点与解决方案
- IT风云15年的那些人、那些事(二)
- Lucas定理与扩展Lucas
- 指标归因平台建设思路
热门文章
- 《刻意练习》学习总结
- thinkphp6阿里云短信新版sdk对接(tp5对接新版阿里云短信sdk)
- Ghost安装系统步骤
- 24种设计模式-生成器模式
- spleetergui2.9汉化版下载 | SpleeterGui(音轨分离软件)官方中文版V2.9.1 | 人声分离软件下载
- yyuc php,yyuc 开发手册.zip 框架 说明指南 Windows Develop 238万源代码下载- www.pudn.com...
- otsu阈值分割算法原理_OTSU阈值分割的实现.doc
- 面对性骚扰,Siri Alexa等AI助手如何应对
- Java移位运算符详解实例
- error C2065: “SHELLEXECUTEINFO”: 未声明的标识符