python中卡方检验_python 使用卡方检验
什么是卡方分析web
卡方分析有两个常见的应用——适合度分析和独立性分析。这个笔记着重于适合度分析。从我目前的经验来看,这也是应用十分普遍的一种统计分析方式。那么什么是卡方适合度分析呢?且听我慢慢道来。svg
现象1 现象2 现象3
观测值 a b c
预期值 A B C
常见的适合度分析的结构以下,通常有两组数据,一组是你统计或者观察到的值,另外一组是理论上的预期值。若是这两组值十分接近,证实观测到的结果很“合适”,若是差距较大,则证实观测到的数据不够“合适”,这就是“适合度分析”名字的含义。函数
这种统计分析在科学研究中是十分经常使用的,由于科学家常常按照理论预期来推测试验结果,而实际上因为各类偏差的存在,实验数据不可能和理论预期彻底一致,这时卡方检验就能很好地检验理论的正确性。测试
举个栗子ui
某科学家预言抛一个色子,各面向上的概率都相同。为了验证本身理论的正确性,该科学家抛了600次硬币,结果为一点102次,二点102次,三点96次,四点105次,五点95次,六点100次。显然这个结果和理论预期并不彻底同样,那么,科学家的理论有错吗?咱们就用Python来验证一下。spa
from scipy import stats
obs = [102, 102, 96, 105, 95, 100]
exp = [100, 100, 100, 100, 100, 100]
stats.chisquare(obs, f_exp = exp)
输出
(0.73999999999999999, 0.98070147251964801)
从结果来看,p 值为0.98,能够认为观测到的值和预期值是相近即“合适”的。科学家的理论没有错,观测值和理论值的不一样是由偶然偏差形成的。(通常 p 值大于0.95便可)code
解释一下server
Python中进行卡方分析的函数chisquare()位于scipy的stats模块中。注意:stats在Python2.7的环境下使用是十分正常的,可是在Python3中使用就会报错。说来惭愧,笔者以前试着在Py3下运行,结果折腾了大半天都没成功,换到Py2.7下,一点问题都没了。若是用Python进行数据分析,我的感受仍是Py2.7好使,不少模块都没有稳定的Py3版啊。固然以前的栗子也要求在Py2.7下运行。xml
scipy.stats.chisquare(f_obs, f_exp=None, ddof=0, axis=0)ip
参数解释以下:
f_obs : 观测值,为一个数列
f_exp : 理论值,为一个数列。若是不赋值,默认为全部状况出现的可能相等。因此栗子中能够不赋值
>>>stats.chisquare(obs)
(0.73999999999999999, 0.98070147251964801)
ddof : 即自由度, df = C - 1,数值上等于全部可能的状况数-1。能够不用赋值,只要obs和exp没问题,程序能够本身算出来。
输出的结果是:
chisq: 即k值
p : p 值,大于0.95即统计显著。
做者:ironbeak_owl
连接:https://www.jianshu.com/p/c307d04eee56
來源:简书
著做权归做者全部。商业转载请联系做者得到受权,非商业转载请注明出处。
python中卡方检验_python 使用卡方检验相关推荐
- python中栈_Python中的栈
Python中的栈 什么是栈 在数据结构中栈和队列可以理解为一种容器.它门也是一种简单的缓存结构,只支持数据的存储和访问.栈中的元素之间相互没有任何和的具体关系,只有时间的相互顺序.栈的相关操作包括数 ...
- python中二进制文件_Python学习基础篇 -6: Python中的文件操作
前言:本专栏以Python为主题,并尽可能保持每星期两到三更,直到将Python的基础知识浅析和讲解完毕,同时,有一定基础的同学可以移步 Python实战专栏 . 文件有有什么用 文件可以看作一个仓库 ...
- python中格式化_Python中格式化的两种方法
在Python中,采用的格式化方式和C语言是一致的,用%实现,举例如下:>>> 'Hello, %s' % 'world' 'Hello, world' >>> ' ...
- python中单行注释_Python中的单行、多行、中文注释方法
Python中的单行.多行.中文注释方法 一.python单行注释符号(#) python中单行注释采用 #开头 示例:#this is a comment 二.批量.多行注释符号 多行注释是用三引号 ...
- python中缩进_python编程中的缩进是什么意思
Python最具特色的是用缩进来标明成块的代码.我下面以if选择结构来举例.if后面跟随条件,如果条件成立,则执行归属于if的一个代码块. 下面对比C语言来看一下if ( i > 0 ) { x ...
- python中参数传递_python中参数传递
在编程语言中,函数的参数传递有两种情况: 按值类型传递 num = 10 def double(arg): arg=arg*2 print(arg) double(num) 调用该函数,传入一个变量, ...
- python中逻辑运算_Python 逻辑运算之 'and' 和 'or'
两种逻辑运算符均为布尔逻辑运算,不返回一个布尔值,而是返回参与运算的两个变量中的一个. 一.Python之and 在布尔上下文中,从左至右进行运算,如果两个变量表达式的运算结果都为真,则返回最后一个表 ...
- python中当地时间_Python 日期和时间
Python日期和时间 阅读本文需要4分钟 Python 程序能用很多方式处理日期和时间,转换日期格式是一个常见的功能. Python 提供了一个 time 和 calendar 模块可以用于格式化日 ...
- python中正则表达式_Python中正则表达式详解
正则表达式是用来简洁表达一组字符串的表达式,本文主要和大家分享Python 中正则表达式知识详解,希望能帮助到大家.操作符说明实例.表示任何单个字符 [ ]字符集,单个字符取值范围[abc]表示a或b ...
- [转载] python中三角函数_Python中的三角函数
参考链接: Python | type()函数 python中三角函数 Python三角函数/方法 (Python Trigonometric functions/methods) In python ...
最新文章
- 5.7.22mysql charset_Mysql5.7.22 坑爹的 `character_set_database`
- HDU多校7 - 6853 Jogging(bfs+结论)
- [linux]【编译】【高级01】 - 动态库的设定和依赖性的检查 20160921更新 文章没有最终结案
- Rsync+Inotify操作文档
- 阿里云加入开放媒体联盟AOM 科技巨头联合推广高清视频新标准
- VS 2017 + EF6 + MySQL5.7 建立实体模型闪退问题
- 高中女销售学Linux云计算4个月搞定年薪12万
- 保护您的眼睛:电脑背景色设置(XP WIN 7)
- work_study_plan
- Java实现阿拉伯数字转换成中文大写数字,以及中文大写数字到阿拉伯数字的转换。
- 对话苏宁张桂平 商协社团·万祥军:全国工商联谋民企凝聚力
- 设置CRT使用Console连接网络设备
- 洛谷 P1361 小猫爬山
- PHP更改表格里文本框的值,JavaScript获取/更改文本框的值的实例代码
- 【网络相关面试问题——八股文篇(下)】
- Rust机器学习之Linfa
- Mac小技巧:重置网络设置指南
- LeetCode-5040-边框着色-C语言
- 重庆思庄Linux技术分享- linux vi与vim的区别
- datacom-IPV6
热门文章
- android 10 多开,多开分身安卓10版
- c++编译时出现discards qualifiers [-fpermissive]的错误
- 【国外网站软件下载慢解决】
- pytorch 网络结构可视化之netron
- 第五届山东理工大学ACM网络编程擂台赛
- c语言与或非,单片机avr c语言位运算 与或非 异或逻辑 运算介绍 详解
- SSM Service ServiceImpl 优缺点
- Tomcat SSL配置 Connector attribute SSLCertificateFile must be defined when using SSL with APR解决 作者:孤风一
- r语言如何计算t分布临界值_R语言系列第四期:R语言单样本双样本差异性检验...
- x265 编码一行,以及vbv上溢/下溢之后的处理