20191104_1_相关性分析
图片是要求,做这个项目没遇到多少问题,因为是老乡,就一会就做完了,看出来大哥是非常想家的,想家里的各种好吃滴,性情中人,期待和大哥在老家相聚
import pandas as pd
#经行数据的读取
from scipy import stats
#利用内置函数进行T,F检验
import numpy as np
#经行数据的转换
from sklearn.linear_model import LinearRegression
#进行线性回归拟合
test=pd.read_excel('data.xlsx')
#进行数据的读取
test.head()
#查看数据的前5行
年份 | 国内旅游收入Y(亿元) | 国内生产总量(亿元) | 旅游人均花费(元) | 城镇居民人均旅游花费(元) | 农村居民人均旅游花费 (元) | 公路里程 (万公里) | 铁路里程(万公里) | 制度 | |
---|---|---|---|---|---|---|---|---|---|
0 | 1994 | 1023.5 | 48637.5 | 195.3 | 414.7 | 54.9 | 111.78 | 5.90 | 0 |
1 | 1995 | 1375.7 | 61339.9 | 218.7 | 464.0 | 61.5 | 115.70 | 5.97 | 0 |
2 | 1996 | 1638.4 | 71813.6 | 256.2 | 534.1 | 70.5 | 118.58 | 6.49 | 0 |
3 | 1997 | 2112.7 | 79715.0 | 328.1 | 599.8 | 145.7 | 122.64 | 6.60 | 0 |
4 | 1998 | 2391.2 | 85195.5 | 345.0 | 607.0 | 197.0 | 127.85 | 6.64 | 0 |
相关性分析
data=test.drop(['国内旅游收入Y(亿元)','制度'],axis=1)
#删除没有不需要进行运算的项
data.corr()
#通过corr列出相关性表
年份 | 国内生产总量(亿元) | 旅游人均花费(元) | 城镇居民人均旅游花费(元) | 农村居民人均旅游花费 (元) | 公路里程 (万公里) | 铁路里程(万公里) | |
---|---|---|---|---|---|---|---|
年份 | 1.000000 | 0.952538 | 0.966061 | 0.976979 | 0.941216 | 0.965176 | 0.945997 |
国内生产总量(亿元) | 0.952538 | 1.000000 | 0.971205 | 0.903729 | 0.961831 | 0.928085 | 0.989733 |
旅游人均花费(元) | 0.966061 | 0.971205 | 1.000000 | 0.945682 | 0.992297 | 0.917496 | 0.971065 |
城镇居民人均旅游花费(元) | 0.976979 | 0.903729 | 0.945682 | 1.000000 | 0.911933 | 0.937125 | 0.903507 |
农村居民人均旅游花费 (元) | 0.941216 | 0.961831 | 0.992297 | 0.911933 | 1.000000 | 0.886918 | 0.961750 |
公路里程 (万公里) | 0.965176 | 0.928085 | 0.917496 | 0.937125 | 0.886918 | 1.000000 | 0.897841 |
铁路里程(万公里) | 0.945997 | 0.989733 | 0.971065 | 0.903507 | 0.961750 | 0.897841 | 1.000000 |
回归分析
X=data
#子变量
y=test['国内旅游收入Y(亿元)']
#因变量
linreg = LinearRegression()
#调用函数
linreg.fit(X,y)
#通过函数进行模拟
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)
print (linreg.intercept_)
#输出常数项
print (linreg.coef_)
#输出系数
1282685.7525530097
[-6.51930861e+02 6.72869974e-02 -1.92976293e+01 1.40380907e+011.11478507e+01 -3.19039647e+01 2.60569416e+03]
#线性函数为y=1282685.7525530097-6.51930861e+02+6.72869974e-02 -1.92976293e+01+1.40380907e+01+1.11478507e+01 -3.19039647e+01 +2.60569416e+03
T检验
#https://www.cnblogs.com/IvyWong/p/10134012.html
stats.ttest_rel(test['城镇居民人均旅游花费(元)'],test['农村居民人均旅游花费 (元)'])
#ttest_ind函数
Ttest_relResult(statistic=31.167470983557163, pvalue=6.2907747913193846e-21)
F检验
stats.f_oneway(test['城镇居民人均旅游花费(元)'],test['农村居民人均旅游花费 (元)'])
#f_oneway函数
F_onewayResult(statistic=85.61876329986252, pvalue=3.019481312593332e-12)
20191104_1_相关性分析相关推荐
- 用spss做多组两两相关性分析_两独立样本T检验及如何利用SPSS实现其操作
上一篇文章我们讲解了有关单样本T检验的相关内容(如何使用SPSS进行单样本检验),其实论文中除了常用到的单样本T检验以外,还有另外一种T检验的方法也是经常用到的统计方法,也就是两独立样本T检验 说到T ...
- 内科学与计算机专业的相关性,急性心肌梗死患者QT间期变异性及心率变异性与室性心律失常的相关性分析-内科学专业论文.docx...
苏州大学学位论文使用授权声明本人完全了解苏州大学关于收集.保存和使用学位论文的规定, 苏州大学学位论文使用授权声明 本人完全了解苏州大学关于收集.保存和使用学位论文的规定, 即:学位论文著作权归属苏州 ...
- Python使用matplotlib可视化相关性分析热力图图heatmap、使用seaborn中的heatmap函数可视化相关性热力图(Correllogram)
Python使用matplotlib可视化相关性分析热力图图heatmap.使用seaborn中的heatmap函数可视化相关性热力图(Correllogram) 目录
- R语言伪相关性分析(Spurious Correlation)、相关关系不是因果关系:以哺乳动物数据集msleep为例
R语言伪相关性分析(Spurious Correlation):相关关系不是因果关系.相关关系不是因果关系.相关关系不是因果关系 #correlation doesn't means causatio ...
- R语言伪相关性分析(Spurious Correlation)、相关关系不是因果关系:以缅因州离婚率数据集为例
R语言伪相关性分析(Spurious Correlation).相关关系不是因果关系:以缅因州离婚率数据集为例 #correlation doesn't means causation 目录
- R语言相关性计算及使用ggcorrplot包相关性分析热力图可视化分析实战
R语言相关性计算及使用ggcorrplot包相关性分析热力图可视化分析实战 目录 R语言相关性计算及使用ggcorrplot包相关性分析热力图可视化分析实战
- python可视化lassocv特征筛选之后的特征的相关性分析热力图
python可视化lassocv特征筛选之后的特征的相关性分析热力图 目录 python可视化lassocv特征筛选之后的特征的相关性分析热力图 #lassocv模型
- R语言描述性统计分析:相关性分析
R语言描述性统计分析:相关性分析 相关性分析:pearson.spearman.kendall 相关性系数的显著性检验: 偏相关性分析: library(ISwR) attach(thuesen) c ...
- R多变量相关性分析及相关性可视化
R多变量相关性分析及相关性可视化 目录 R多变量相关性分析及相关性可视化 多变量相关性计算
- 语言相关系数显著性_相关性分析在SPSS中的具体操作,一文读懂相关系数的含义及使用——【杏花开生物医药统计】...
相关性分析介绍 生物和医学统计中,相关分析属于流程前端的探索性分析,研究变量间关系及性质,其结果在为下一步采取何种方法做出指引,为数据挖掘之前的基础工作. 相关系数的选择 相关分析之前,需要先确认变量 ...
最新文章
- python的 局部变量与全局变量
- 注意!我们熟知的“摩尔定律”被废了...
- SAP的实施公司有哪些?
- FM之DATE_CHECK_PLAUSIBILITY
- SAP Cloud for Customer的work center显示逻辑
- 如何启用nodejs request模块的调试模式
- opencv中的一些陷阱 坑死我了~~~~(_)~~~~
- Leaflet文档阅读笔记-Using GeoJSON with Leaflet笔记
- SpringBoot2 整合Kafka组件,应用案例和流程详解
- python运维处理序列_Python运维开发:02 序列
- 解决阿里云主机受到攻击的问题 2
- Gartner:2017年全球公有云服务市场增长18%
- C语言的结构变量定义规则,嵌入式学习笔记:c语言结构体的定义和使用
- 第26课:JSP Cookie 处理 读取和删除cookie(JSP教程 JSP入门实战教程 黄菊华Java网站开发系列教程)
- java项目笔记 - 第16章:坦克大战1.0
- 「CodePlus 2017 11 月赛」大吉大利,晚上吃鸡!(dij+bitset)
- 2022-03-27 screenX和clientX的区别以及offsetX和pageX的区别
- 《矩阵理论与方法》lambda矩阵及Jordan标准形
- vue点tab不刷新页面_如何使tab页切换,页面不刷新
- 随机动漫图片API接口
热门文章
- 配置WindowsLiveWriter,写cnblogs博客
- JavaScript 函数参数是传值(byVal)还是传址(byRef)?
- java day52【综合案例day04】
- leetcode 153. 寻找旋转排序数组中的最小值(Find Minimum in Rotated Sorted Array)
- 520 简单表白代码(JS)
- 第二阶段冲刺第六天站立会议
- 关于Easy ui 操作 控件 disable 整理
- HDU 2209 翻纸牌游戏
- POJ 2185 Milking Grid KMP循环节周期
- java 访问 usb