本文主要记录了python对数据进行相关性统计检验的实现方法。

主要是:

1、连续变量VS连续变量:皮尔逊相关系数

2、分类变量VS分类变量:卡方检验

3、连续变量VS多分类变量:F检验

4、连续变量VS二分类变量:若连续变量满足正态分布,则用t检验,否则应用曼-惠特尼U检验

主要的python脚本如下:

from sklearn.feature_selection import SelectKBest,chi2

from scipy import stats

from scipy.stats import ttest_ind, levene

def corr_continue_continue(series_1,series_2):

corr = pearsonr(series_1,series_2)[1]

return corr

def corr_cate_cate(series_1,series_2):

series_1 = np.array(series_1).reshape(-1,1)

model1 = SelectKBest(chi2, k=1)

model1.fit_transform(series_1, series_2)

corr = model1.scores_[0]

p_value = model1.pvalues_[0]

return corr,p_value

def corr_continue_multicate(fenlei_series_1,lianxu_series_2):

f,p = stats.f_oneway(fenlei_series_1,lianxu_series_2)

return f,p

def normal_test(series):

u = series.mean()

std = series.std()

statistic,pvalue = stats.kstest(series,'norm',(u,std))

return statistic,pvalue

def corr_continue_twocate(data,fenlei_var,lianxu_var):

fenlei = list(set(data[fenlei_var]))

series_1 = data[lianxu_var][data[fenlei_var]==fenlei[0]]

series_2 = data[lianxu_var][data[fenlei_var]==fenlei[1]]

stats_1,pvalue_1 = normal_test(series_1)

stats_2,pvalue_2 = normal_test(series_2)

if pvalue_1 < 0.05 or pvalue_2 < 0.05:

t_value,p_value = stats.mannwhitneyu(series_1,series_2,alternative='two-sided')

else:

_,levene_p_value = levene(series_1,series_2)

if levene_p_value>0.05:

t_value,p_value = ttest_ind(series_1,series_2)

else:

t_value,p_value = ttest_ind(series_1,series_2,equal_var=False)

return t_value,p_value,pvalue_1,pvalue_2

python进行各项统计检验_运用python进行相关性统计检验相关推荐

  1. python大牛 关东升_《Python从小白到大牛》第4章 Python语法基础

    本章主要为大家介绍Python的一些语法,其中包括标识符.关键字.常量.变量.表达式.语句.注释.模块和包等内容. 标识符和关键字 任何一种计算机语言都离不开标识符和关键字,因此下面将详细介绍Pyth ...

  2. python之禅 中文_《Python之禅》中对于Python编程过程中的一些建议

    <Python之禅>中对于Python编程过程中的一些建议 来源:中文源码网    浏览: 次    日期:2018年9月2日 [下载文档:  <Python之禅>中对于Pyt ...

  3. python画交互式地图_使用Python构建交互式地图-入门指南

    python画交互式地图 Welcome to The Beginner's Guide to Building Interactive Maps in Python 欢迎使用Python构建交互式地 ...

  4. python出现的意义_[转]Python中下划线以及命名空间的意义

    Python 用下划线作为变量前缀和后缀指定特殊变量/方法. 主要存在四种情形 1. 1. object # public 2. __object__ # special, python system ...

  5. python剪辑视频 裁剪_用python进行视频剪辑

    一.目标 python,利用moviepy和pydub将一段视频进行区间切割 二.源码 import os from moviepy.video.io.VideoFileClip import Vid ...

  6. python大数据免费_用python做大数据

    不学Python迟早会被淘汰?Python真有这么好的前景? 最近几年Python编程语言在国内引起不小的轰动,有超越Java之势,本来在美国这个编程语言就是最火的,应用的非常非常的广泛,而Pytho ...

  7. python字符串去掉空行_从python中的字符串中删除空格

    python字符串去掉空行 如何在python中删除字符串中的空格 (How to remove whitespaces in a string in python) str.lstrip()str. ...

  8. 用python做自我介绍_用python做个自我介绍(python入门教程)_逻辑教育

    原标题:用python做个自我介绍(python入门教程)_逻辑教育 本文涉及的python基础语法为:数据类型等 数字类型 1. 字符串的拼接 我们在上一章中已经简单介绍了一下字符串的创建方式,这里 ...

  9. python delimiter分隔符用法_使用Python文件读写,自定义分隔符(custom delimiter)

    众所周知,python文件读取文件的时候所支持的newlines(即换行符),是指定的.这一点不管是从python的doucuments上还是在python的源码中(作者是参考了python的io版本 ...

最新文章

  1. CRichEdit小记
  2. SQLyog中TAB键设置四个空格的步骤
  3. leetcode:44. 通配符匹配
  4. 利用python来解析html
  5. linux看java堆大小,linux 改java堆内存大小
  6. JS实现的一个验证码,可以在前端验证后在提交action
  7. windbg 修改内存和寄存器指令
  8. Vue工程引入openlayers组件的方法
  9. VJC案例-走五角星
  10. gyp verb ensuring that file exists: C:\Python27\python.exe
  11. Android pad 刷成苹果,利用安卓手机运行checkra1n越狱你的iPhone/iPad教程,支持12.3-13.5-13.7-14.3-14.4系统...
  12. 最小二乘法:求回归直线方程
  13. MATLAB——LTI Viewer
  14. elasticsearch-starter
  15. npm install时cb() never called!错误解决方法
  16. 《C程序设计快速进阶大学教程》第8章编程题
  17. 第10章 数据库恢复技术 | 数据库知识点整理
  18. Mybatis 和 Mybatis Plus 的区别
  19. 定理:正交向量组一定线性无关
  20. c语言:关于vs2012使用easyX的loadimage()加载资源图片

热门文章

  1. Easy Task —— 强大易用的分布式任务调度平台
  2. 计算机教师资格证怎么报名时间,教师资格证考试必须在电脑上报名吗?
  3. 30个网站产品落地页免费模板(附下载)
  4. java不失精度的小数计算工具类
  5. 前锋PHP课程表,练手Lab课程表小程序源码 v1.0.0
  6. python多线程调用携程,Python 协程,Python携程
  7. Windows 2008 如何开启并使用Windows Vista的主题
  8. matrix67文章学习
  9. 高校校园IPTV系统升级方案
  10. mac 怎么降低php版本吗,mac下如何安装不同的php版本以及如何进行切换