单变量分析绘图及回归分析绘图【知识整理】
单变量分析绘图及回归分析绘图
- 综述
- 代码模块
- 单变量分析绘图
- 数据直方图
- 数据分布状态
- 指定均值及协方差生成数据
- 散点图观测
- 多特征分析
- 回归分析绘图
- tips数据集读入
- 绘制回归图
- 离散型数据分析
- 增加直方图后的回归图绘制
- 小结
综述
学生党整理一些关于数据分析的知识:整理了单变量分析绘图及回归分析绘图的部分代码。主要包括了数据直方图、数据分布状态、指定均值协方差生成数据、散点图绘制、多特征分析;绘制回归图、离散型数据分析及直方图散点图结合的回归图绘制。
代码模块
调用库
import seaborn as sns
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats, integrate
单变量分析绘图
数据直方图
通过数据直方图可以观测变量的分布状况
sns.set(color_codes=True)
np.random.seed(sum(map(ord,"distributions")))x = np.random.normal(size=100)
sns.distplot(x,kde=False)
plt.show()
指定bins = 20
sns.distplot(x,bins=20,kde=False)
plt.show()
数据分布状态
数据柱状图和曲线图表示数据分布状态
x = np.random.normal(6,size=200)
sns.distplot(x,kde=False,fit=stats.gamma)
plt.show()
指定均值及协方差生成数据
mean, cov = [0, 1], [(1, .5),(.5, 1)] #指定均值,协方差
data = np.random.multivariate_normal(mean, cov,200)
df = pd.DataFrame(data,columns=['x','y'])
print(df)
生成数据样例如下
x | y | |
---|---|---|
0 | -0.880210 | 1.255051 |
1 | 0.191488 | -0.000265 |
… | … | … |
198 | 1.499932 | 3.881606 |
199 | 0.893239 | 1.196291 |
散点图观测
观测两个变量之间的分布关系最好用散点图
sns.jointplot(x='x',y='y',data=df)
plt.show()
该方式绘制的散点图包括了x,y的直方图
当数据量庞大时可以用hex图
x, y = np.random.multivariate_normal(mean,cov,1000).T
with sns.axes_style("white"):sns.jointplot(x = x,y = y,kind="hex",color = "k")
plt.show()
数据量过大时,直接绘制散点图会导致多点重合无法分析的情况,采用hex图,可以将数据划分区域,用颜色深浅表示
多特征分析
分析多变量中各个变量之间的关系时,可以使用
sns.set()
iris = pd.read_csv('iris.csv') #读入iris数据
iris = sns.load_dataset("iris")
sns.pairplot(iris)
plt.show()
回归分析绘图
tips数据集读入
tips = pd.read_csv('tips.csv')
np.random.seed(sum(map(ord, "regression")))
tips = sns.load_dataset('tips')
print(tips.head())
total_bill | tip | sex | smoker | day | time | size | |
---|---|---|---|---|---|---|---|
0 | 16.99 | 1.01 | Female | No | Sun | Dinner | 2 |
1 | 10.34 | 1.66 | Male | No | Sun | Dinner | 3 |
2 | 21.01 | 3.50 | Male | No | Sun | Dinner | 3 |
3 | 23.68 | 3.31 | Male | No | Sun | Dinner | 2 |
4 | 24.59 | 3.61 | Female | No | Sun | Dinner | 4 |
绘制回归图
绘制回归关系图时,常用regplot()和lmplot(),推荐使用regplot()。regplot()使用方便, lmplot()功能多,规范要求高。
sns.regplot(x = 'total_bill',y = 'tip',data = tips)
plt.title('regplot')
plt.show()
sns.lmplot(x = 'total_bill',y = 'tip',data = tips)
plt.title('lmplot')
plt.show()
离散型数据分析
直接绘图
sns.regplot(data=tips,x='size',y='tip')
plt.show()
由于数据离散,对回归结果有影响,可以适当增加波动提高回归准确性
sns.regplot(x='size',y='tip',data= tips,x_jitter = .05)
plt.show()
增加直方图后的回归图绘制
mean, cov = [0, 1], [(1, .5),(.5, 1)] #指定均值,协方差
data = np.random.multivariate_normal(mean, cov,200)
df = pd.DataFrame(data,columns=['x','y'])sns.jointplot(x='x',y='y',data=df,kind='reg')
plt.show()
小结
绘图知识整理部分主要针对绘图方法,具体在数据分析过程中使用哪种图片在之后具体的数据分析案例中详细说明。
单变量分析绘图及回归分析绘图【知识整理】相关推荐
- 多变量分析绘图及分类属性绘图【知识整理】
多变量分析绘图及分类属性绘图 综述 代码模块 多指标离散图绘制 盒图 violin图 条形图 点图 多层面板分类图 factorplot()详细说明 小结 综述 学生党整理一些关于数据分析的知识:整理 ...
- python seaborn_Python数据分析之Seaborn(回归分析绘图)
Seaborn回归分析绘图 %matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib as mplimpor ...
- 计算机绘图入门,[2018年最新整理]AutoCAD计算机绘图入门.ppt
[2018年最新整理]AutoCAD计算机绘图入门 第二章 AutoCAD2008绘图入门 本章内容:AutoCAD基本功能 重点:基本操作 §1创建新图形文件 1.命令:NEW 2.标准工具条:白纸 ...
- Python数据分析之单变量分析
0 引言 在数据分析或者机器学习过程中,我们需要对变量或者特征进行分析,在分析过程中,一般都会分为两种:单变量分析.双变量分析.今天,土豆简单介绍一下单变量分析,单变量分析主要对单个变量或者特征进行分 ...
- (金融)线上消费贷风控优化(单变量分析)与用户留存(同期群分析)项目——数据分析
(金融)线上消费贷风控优化(单变量分析)与用户留存项目(同期群分析)--数据分析 一.首逾率单变量分析 案例背景: 日常监控发现某款消费贷产品首逾率有逐渐升高的趋势,需要把首逾率降下来以减少产品带来的 ...
- 数模中常使用的Matlab绘图与Excel绘图
最近经常用到绘图,本菜鸡QAQ就把这部分所需要的知识整理了一下(此文用的是matlab2014a),方便以后懒得去查找资料啦~ 绘图颜色与线型 颜色 Matlab的plot函数里所带的基本颜色有8钟, ...
- Spring AOP 知识整理
为什么80%的码农都做不了架构师?>>> AOP知识整理 面向切面编程(AOP)通过提供另外一种思考程序结构的途经来弥补面向对象编程(OOP)的不足.在OOP中模块化的关键单元 ...
- 计算机二级c语基础知识,计算机二级C语基础知识整理.doc
计算机二级C语基础知识整理 1.1 算法 算法:是一组有穷指令集,是解题方案的准确而完整的描述.通俗地说,算法就是计算机解题的过程.算法不等于程序,也不等于计算方法,程序的编制不可能优于算法的设计. ...
- -%3e运算符在c语言中的作用,C语言逻辑运算符知识整理
在高中数学中,我们学过逻辑运算,例如p为真命题,q就假命题,那么"p且q"为假,"p或q"为真,"非q"为真. 在C语言中,也有类似的逻辑运 ...
最新文章
- CoAP 协议解析说明(转)
- iOS 获取本地图片URL
- 帝国cms后台上传大视频上传m3u8批量上传一次多个的解决思路和方法
- 认识VC++类向导的使用
- 8080处理器计算机启动
- 在用visio作图形界面设计,控件对齐的工具按钮
- ubuntu自动提醒
- ​手把手教你如何进行 Golang 单元测试
- P4316 绿豆蛙的归宿 期望dp + DAG
- VXWORKS 几种定时机制
- Linux-windows10下安装Ubuntu
- 超级计算机 500,191台超算500强排名分布区间:前百强4台,前两百强31台
- 《Qt基础教程之Qt学习之路》
- WPF实现DoEvents
- Pillow教程(一)
- asin、acos、atan 和 atan2 函数用法简介
- 准备入行java怎么才能更快学习
- oracle sysobject,SQL2000数据库提示未能读取并闩锁页 sysobjects 失败数据库修复
- 万豪国际成立全球清洁卫生委员会,推行更高标准清洁消毒措施
- php发邮件附件,PHP使用PHPMailer发送邮件和附件的方法
热门文章
- 北京Linux运维培训怎么选?
- hive的set优化_Hive优化(整理版)
- bash 获取脚本存放路径_如何获取Bash脚本自己的路径
- php样式模板,word样式和模板的区别
- 有向图 寻路算法_第2部分探索寻路图算法
- autojs-toast-多彩气泡
- 利用JVM在线调试工具排查线上问题(超实用)
- 合作开发后谈如何写文档
- 【异常】记录“错误: 找不到或无法加载主类 com.iotsoft.back.iotauthority.ApplicationRun”的解决方案
- java计算机毕业设计高校多媒体设备运维管理系统服务端(附源码、数据库)