目录

  • 1 先导入一些包
  • 2 导入数据
    • (1)从excel表导入
  • 3 手动创建数据
  • 4 数据排序
  • 5 对数据进行简单计算
  • 6 对数据进行0-1标准化
  • 7 基本的描述统计指标
  • 8 分组统计
  • 9 相关分析
  • 10 绘制散点图
  • 11 线性回归模型

1 先导入一些包

本文的数据分析均在anaconda中的Spyder中进行。

import pandas
from sklearn.linear_model import LinearRegression
import matplotlib
import matplotlib.pyplot as plt

2 导入数据

(1)从excel表导入

下面的截图是data.xlsx中的数据,sheet的名字data1。

执行如下代码

# 利用pandas里的read_excel函数
# 注意两个地方,一是写好文件路径(包括文件名)
# 二是写好导入文件中哪个sheet
data = pandas.read_excel('D:/7_science_and_technology/数据分析/data.xlsx',sheet_name='data1'

结果如下:

3 手动创建数据

# 利用pandas里的DataFrame手动创建
# '变量名':[...,...,...,...,]
data_2 = pandas.DataFrame({'catalog': ['A','B','C','D','E'],'percent': [0.1, 0.15, 0.4, 0.6, 0.9]})

结果如下:

利用plot.bar函数画个直方图:

data_2.plot.bar(x = 'catalog', y='percent')

结果如下:

4 数据排序

# True代表升序排列,False代表降序排列
sortData = data.sort_values(by = ['数学成绩','语文成绩'],ascending = [True, False])

结果如下:

5 对数据进行简单计算

# 对数据进行简单计算
data['总成绩'] = data.数学成绩 + data.语文成绩

结果如下:

6 对数据进行0-1标准化

# 对数据0-1标准化
data['语文成绩标准化'] = round((data.语文成绩 - data.语文成绩.min())/(data.语文成绩.max() - data.语文成绩.min()))

结果如下:

7 基本的描述统计指标

# 基本描述统计
print(data.总成绩.describe())

结果如下:

8 分组统计

# 按性别进行分组统计
ga = data.groupby(by = ['性别'])['语文成绩'].agg('count')
print(ga)
print(ga.sum())  # 案例总数
print(ga/ga.sum()) # 计算比例

结果如下:

9 相关分析

# 相关分析:语文成绩、数学成绩
corrMatrix = data[['数学成绩','语文成绩']].corr()
print(corrMatrix)

结果如下:

10 绘制散点图

# 绘制散点图
#data.plot('数学成绩','语文成绩', kind = 'scatter')
plt.scatter(data['数学成绩'], data['语文成绩'])

结果如下:

11 线性回归模型

# 回归模型
x = data[['数学成绩']]
y = data[['语文成绩']]
lrModel = LinearRegression()
lrModel.fit(x, y)
print(lrModel.coef_)
print(lrModel.intercept_)
# 回归模型的精度
print(lrModel.score(x, y))

python数据分析(一):导入数据、描述统计、交叉分析、相关分析、线性回归分析相关推荐

  1. python数据分析与挖掘建模:交叉分析

    前言 交叉分析是属性间的数据分析.本次实验中我们主要分析离职率("left")与各部门("depar")之间的关系,各部门之间的离职率是否有明显的差异,使用到的 ...

  2. Python数据分析大作业 4000+字 图文分析文档 销售分析

    资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码 数据来自某商场,具体商业数据保密 资源地址:Python数据分析大作业 4000+字 图文分析文档 ...

  3. 【python】用python实现wordcloud大数据词云图分析

    [python]用python实现wordcloud大数据词云图分析 一.应用场景 二.工具包安装及代码 三.中文不能正常显示问题 四.关键词重复问题 五.最终结论 一.应用场景 大数据词云(word ...

  4. Python数据分析实战:降雨量统计分析报告分析

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于菜J学Python ,作者小小明 最近遇到一个有点烧脑的需求,其实也不算烧pytho ...

  5. Python数据分析pandas之数据拼接与连接

    Python数据分析pandas之数据拼接与连接 数据拼接处理 数据拼接处理指的是numpy.pandas里对数据的拼接.连接.合并等多种方法的概称.有时我们处理的数据会分很多步骤,而中间或者最终的结 ...

  6. Python爬取天气数据及可视化分析!

    来源丨Python之王 Python爬取天气数据及可视化分析 说在前面 天气预报我们每天都会关注,我们可以根据未来的天气增减衣物.安排出行,每天的气温.风速风向.相对湿度.空气质量等成为关注的焦点.本 ...

  7. Python爬取天气数据及可视化分析

    Python爬取天气数据及可视化分析 文章目录 Python爬取天气数据及可视化分析 说在前面 1.数据获取 请求网站链接 提取有用信息 保存csv文件 2.可视化分析 当天温度变化曲线图 当天相对湿 ...

  8. Python数据分析中的数据预处理:数据标准化

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python数据分析中的 数据预处理:数据标准化 ● 选择题 以下关于 ...

  9. Python 数据分析三剑客之 Matplotlib(四):线性图的绘制

    CSDN 课程推荐:<Python 数据分析与挖掘>,讲师刘顺祥,浙江工商大学统计学硕士,数据分析师,曾担任唯品会大数据部担任数据分析师一职,负责支付环节的数据分析业务.曾与联想.亨氏.网 ...

  10. Python数据分析之--运动员数据揭秘(一)

    在网易云课堂看了城市数据团的课程,对理解利用pytthon进行数据分析的基本流程很有帮助,因此进行复盘总结,加深自己的理解,巩固相关操作. 分析资料及工具:Spyder/Python3.6/Excle ...

最新文章

  1. python post json数据_Python POST Json数据到Http
  2. linux 基本指令
  3. 互联网公司各种“花式”裁员,套路特别深,作为程序员你知道吗?
  4. set集合以及知识点补充
  5. 如何对您的API进行单元测试
  6. 老项目换unicorn的大致步骤
  7. python适配器模式角色_适配器模式(Adapter模式)详解
  8. 看故事也能长知识,CPU的工作原理原来这么简单!
  9. 热分析(一):什么是热仿真/热分析?
  10. UE4 坐标系 坐标轴旋转轴
  11. 5 个免费的受欢迎的 SQLite 管理工具
  12. 16 岁少年前往腾讯总部要求解封 QQ 账号;微软发内部信辟谣:没有关闭微软苏州的相关计划;Go 1.20 发布|极客头条
  13. 天津市科技领军企业和领军培育企业补助奖励及认定条件,补贴500万
  14. HLS/m3u8之sample-aes解密及软件开发
  15. 什么是Java?什么是JavaWeb?
  16. 如何解决1万个并发连接,用每个客户一个线程的方法
  17. Android性能优化OOM内存管理——ADJ
  18. java实现客户端脚本录制_(二)appium-desktop录制脚本二次开发,生成我司自动化脚本...
  19. 【ElasticSearch笔记】
  20. Microsoft Office

热门文章

  1. vue {{}}中小数保留几位小数的toFixed(小数位数)方法
  2. 1、智能盆栽初步了解
  3. 转置卷积中的棋盘效应
  4. 【2021年最新版Java校招面试题目合集】
  5. JavaScript在表格中实现九九乘法表
  6. (PTA)数据结构(作业)8、期中测验
  7. Linux/Ubuntu18.04安装RTL8811cu驱动
  8. java学习笔记(23)java表单标签
  9. FBEC2020大会圆满闭幕!区块链分会场人气爆棚!
  10. SpringCloud-25-Gateway:动态路由、过滤器使用