python数据分析(一):导入数据、描述统计、交叉分析、相关分析、线性回归分析
目录
- 1 先导入一些包
- 2 导入数据
- (1)从excel表导入
- 3 手动创建数据
- 4 数据排序
- 5 对数据进行简单计算
- 6 对数据进行0-1标准化
- 7 基本的描述统计指标
- 8 分组统计
- 9 相关分析
- 10 绘制散点图
- 11 线性回归模型
1 先导入一些包
本文的数据分析均在anaconda中的Spyder中进行。
import pandas
from sklearn.linear_model import LinearRegression
import matplotlib
import matplotlib.pyplot as plt
2 导入数据
(1)从excel表导入
下面的截图是data.xlsx中的数据,sheet的名字data1。
执行如下代码
# 利用pandas里的read_excel函数
# 注意两个地方,一是写好文件路径(包括文件名)
# 二是写好导入文件中哪个sheet
data = pandas.read_excel('D:/7_science_and_technology/数据分析/data.xlsx',sheet_name='data1'
结果如下:
3 手动创建数据
# 利用pandas里的DataFrame手动创建
# '变量名':[...,...,...,...,]
data_2 = pandas.DataFrame({'catalog': ['A','B','C','D','E'],'percent': [0.1, 0.15, 0.4, 0.6, 0.9]})
结果如下:
利用plot.bar函数画个直方图:
data_2.plot.bar(x = 'catalog', y='percent')
结果如下:
4 数据排序
# True代表升序排列,False代表降序排列
sortData = data.sort_values(by = ['数学成绩','语文成绩'],ascending = [True, False])
结果如下:
5 对数据进行简单计算
# 对数据进行简单计算
data['总成绩'] = data.数学成绩 + data.语文成绩
结果如下:
6 对数据进行0-1标准化
# 对数据0-1标准化
data['语文成绩标准化'] = round((data.语文成绩 - data.语文成绩.min())/(data.语文成绩.max() - data.语文成绩.min()))
结果如下:
7 基本的描述统计指标
# 基本描述统计
print(data.总成绩.describe())
结果如下:
8 分组统计
# 按性别进行分组统计
ga = data.groupby(by = ['性别'])['语文成绩'].agg('count')
print(ga)
print(ga.sum()) # 案例总数
print(ga/ga.sum()) # 计算比例
结果如下:
9 相关分析
# 相关分析:语文成绩、数学成绩
corrMatrix = data[['数学成绩','语文成绩']].corr()
print(corrMatrix)
结果如下:
10 绘制散点图
# 绘制散点图
#data.plot('数学成绩','语文成绩', kind = 'scatter')
plt.scatter(data['数学成绩'], data['语文成绩'])
结果如下:
11 线性回归模型
# 回归模型
x = data[['数学成绩']]
y = data[['语文成绩']]
lrModel = LinearRegression()
lrModel.fit(x, y)
print(lrModel.coef_)
print(lrModel.intercept_)
# 回归模型的精度
print(lrModel.score(x, y))
python数据分析(一):导入数据、描述统计、交叉分析、相关分析、线性回归分析相关推荐
- python数据分析与挖掘建模:交叉分析
前言 交叉分析是属性间的数据分析.本次实验中我们主要分析离职率("left")与各部门("depar")之间的关系,各部门之间的离职率是否有明显的差异,使用到的 ...
- Python数据分析大作业 4000+字 图文分析文档 销售分析
资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码 数据来自某商场,具体商业数据保密 资源地址:Python数据分析大作业 4000+字 图文分析文档 ...
- 【python】用python实现wordcloud大数据词云图分析
[python]用python实现wordcloud大数据词云图分析 一.应用场景 二.工具包安装及代码 三.中文不能正常显示问题 四.关键词重复问题 五.最终结论 一.应用场景 大数据词云(word ...
- Python数据分析实战:降雨量统计分析报告分析
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于菜J学Python ,作者小小明 最近遇到一个有点烧脑的需求,其实也不算烧pytho ...
- Python数据分析pandas之数据拼接与连接
Python数据分析pandas之数据拼接与连接 数据拼接处理 数据拼接处理指的是numpy.pandas里对数据的拼接.连接.合并等多种方法的概称.有时我们处理的数据会分很多步骤,而中间或者最终的结 ...
- Python爬取天气数据及可视化分析!
来源丨Python之王 Python爬取天气数据及可视化分析 说在前面 天气预报我们每天都会关注,我们可以根据未来的天气增减衣物.安排出行,每天的气温.风速风向.相对湿度.空气质量等成为关注的焦点.本 ...
- Python爬取天气数据及可视化分析
Python爬取天气数据及可视化分析 文章目录 Python爬取天气数据及可视化分析 说在前面 1.数据获取 请求网站链接 提取有用信息 保存csv文件 2.可视化分析 当天温度变化曲线图 当天相对湿 ...
- Python数据分析中的数据预处理:数据标准化
[小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python数据分析中的 数据预处理:数据标准化 ● 选择题 以下关于 ...
- Python 数据分析三剑客之 Matplotlib(四):线性图的绘制
CSDN 课程推荐:<Python 数据分析与挖掘>,讲师刘顺祥,浙江工商大学统计学硕士,数据分析师,曾担任唯品会大数据部担任数据分析师一职,负责支付环节的数据分析业务.曾与联想.亨氏.网 ...
- Python数据分析之--运动员数据揭秘(一)
在网易云课堂看了城市数据团的课程,对理解利用pytthon进行数据分析的基本流程很有帮助,因此进行复盘总结,加深自己的理解,巩固相关操作. 分析资料及工具:Spyder/Python3.6/Excle ...
最新文章
- python post json数据_Python POST Json数据到Http
- linux 基本指令
- 互联网公司各种“花式”裁员,套路特别深,作为程序员你知道吗?
- set集合以及知识点补充
- 如何对您的API进行单元测试
- 老项目换unicorn的大致步骤
- python适配器模式角色_适配器模式(Adapter模式)详解
- 看故事也能长知识,CPU的工作原理原来这么简单!
- 热分析(一):什么是热仿真/热分析?
- UE4 坐标系 坐标轴旋转轴
- 5 个免费的受欢迎的 SQLite 管理工具
- 16 岁少年前往腾讯总部要求解封 QQ 账号;微软发内部信辟谣:没有关闭微软苏州的相关计划;Go 1.20 发布|极客头条
- 天津市科技领军企业和领军培育企业补助奖励及认定条件,补贴500万
- HLS/m3u8之sample-aes解密及软件开发
- 什么是Java?什么是JavaWeb?
- 如何解决1万个并发连接,用每个客户一个线程的方法
- Android性能优化OOM内存管理——ADJ
- java实现客户端脚本录制_(二)appium-desktop录制脚本二次开发,生成我司自动化脚本...
- 【ElasticSearch笔记】
- Microsoft Office