一、数据分析和介绍

二、认识jupyter notebook

打开Anaconda:

win + R打开运行,输入cmd进入命令提示符

在命令提示符内输入 jupyter notebook 即可打开

创建文件夹


勾选中后可进行移动和重命名操作


并非.py格式


三、matplotlib模块


from matplotlib import pyplot as plt # 导入matplotlib模块中的 pyplot类,命名为 pltx = range(2,26,2) # 定义x轴
y = [15,13,14.5,17,20,25,25,26,27,22,18,15] # 定义y轴plt.plot(x,y) # 绘制
plt.show() # 显示

1、设置显示图片大小和保存当前图片

from matplotlib import pyplot as plt # 导入matplotlib模块中的 pyplot类,命名为 pltx = range(2,26,2) # 定义x轴
y = [15,13,14.5,17,20,25,25,26,27,22,18,15] # 定义y轴
# 图片大小设置
plt.figure(figsize=(20,8),dpi=100) # figure(figsize=(横,纵),dpi=数值越大越清晰)
plt.plot(x,y) # 绘制
# 保存
plt.savefig("./savefig.png")
plt.show() # 显示



svg格式:

2、调整x或y轴的刻度

from matplotlib import pyplot as plt # 导入matplotlib模块中的 pyplot类,命名为 pltx = range(2,26,2) # 定义x轴
y = [15,13,14.5,17,20,25,25,26,27,22,18,15] # 定义y轴
# 图片大小设置
plt.figure(figsize=(20,8),dpi=100) # figure(figsize=(横,纵),dpi=数值越大越清晰)
plt.xticks(x) # 会根据给到的列表一一绘制出点位
plt.plot(x,y) # 绘制
# 保存
plt.savefig("./savefig.svg")
plt.show() # 显示


可以使用列表推导式来生成自己想要的列表


x = range(2,26,2) # 定义x轴
y = [15,13,14.5,17,20,25,25,26,27,22,18,15] # 定义y轴
# 图片大小设置
plt.figure(figsize=(20,8),dpi=100) # figure(figsize=(横,纵),dpi=数值越大越清晰)
new_x = [a/2 for a in range(4,50)] # 可以用列表推导式生成想要的列表
plt.xticks(new_x) # 会根据给到的列表一一绘制出点位
plt.plot(x,y) # 绘制
# 保存
plt.savefig("./savefig.svg")
plt.show() # 显示


from matplotlib import pyplot as plt
import random
a = [random.randint(20,35) for i in range(120)]
new_x = [A for A in range(1,121)]
plt.figure(figsize=(45,5),dpi=100)
plt.xticks(new_x)
plt.yticks(a)
plt.plot(new_x,a)
plt.savefig("./savefig.svg")
plt.show()

未截取全部(图片过长)

汉字显示:
显示汉字时需要先设置一下字体,否则会报错

# 设置字体
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7) # 设置字体(需要导入matplotlib模块中的font_manager):font_manager.FontProperties(fname=r"字体路径",size=字体大小)
from matplotlib import pyplot as plt
import random
from matplotlib import font_manager
y = [random.randint(20,35) for i in range(120)]
new_x = range(0,120)
new_xx = new_x# 设置字体
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=10) # 设置字体(需要导入matplotlib模块中的font_manager):font_manager.FontProperties(fname=r"字体路径",size=字体大小)new_x2 = ["10点{0}分".format(A) for A in range(60)] # 设置x轴字体,由于一个小时只有60分所以将120分拆开成2小时(列表)
new_x2 += ["11点{0}分".format(A) for A in range(60)]plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
plt.xticks(new_x[::4],new_x2[::4],rotation= -45,fontproperties = ziti) # plt.xticks(数字(时间),汉字(时间),rotation= 旋转角度,fontproperties = 字体)plt.plot(new_x,y)
plt.savefig("./savefig.png")
plt.show()


对x轴,y轴和整体做一个单独的标签 x/ylabel() ;title():

from matplotlib import pyplot as plt
import random
from matplotlib import font_manager
y = [random.randint(20,35) for i in range(120)]
new_x = range(0,120)
new_xx = new_x# 设置字体
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7) # 设置字体(需要导入matplotlib模块中的font_manager):font_manager.FontProperties(fname=r"字体路径",size=字体大小)new_x2 = ["10点{0}分".format(A) for A in range(60)] # 设置x轴字体,由于一个小时只有60分所以将120分拆开成2小时(列表)
new_x2 += ["11点{0}分".format(A) for A in range(60)]plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
plt.xticks(new_x[::4],new_x2[::4],rotation= -45,fontproperties = ziti) # plt.xticks(数字(时间),汉字(时间),rotation= 旋转角度,fontproperties = 字体)# 标签
plt.xlabel("时间",fontproperties = ziti) # 一定要设置字体否则输出中文会报错
plt.ylabel("温度",fontproperties = ziti) # 一定要设置字体否则输出中文会报错
plt.title("10点到12点的每分钟变化",fontproperties = ziti) # 一定要设置字体否则输出中文会报错plt.plot(new_x,y)
plt.savefig("./savefig.svg")
plt.show()


from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)
plt.plot(NL,a)
plt.savefig("./savefig.svg")
plt.show()


绘制网格grid():

from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)# 绘制网格
plt.grid(alpha=0.5) # grid 设置网格,alpha=网格透明度(最大为1)plt.plot(NL,a)
plt.savefig("./savefig.svg")
plt.show()


from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1,2,1,1,1,1,1,1,1,1,1]a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)# 绘制网格
plt.grid(alpha=0.5) # grid 设置网格,alpha=网格透明度(最大为1)plt.plot(NL,a)
plt.plot(NL,b) # 绘制另外一条plt.savefig("./savefig.svg")
plt.show()


为每条线标上标签:

from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1,2,1,1,1,1,1,1,1,1,1]a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)# 绘制网格
plt.grid(alpha=0.5) # grid 设置网格,alpha=网格透明度(最大为1)plt.plot(NL,a,label = "自己")
plt.plot(NL,b,label = "同桌") # 绘制另外一条
plt.legend(prop = ziti,loc = 2) # 设置每条线的标签 plt.legend(prop = 字体路径,loc = 位置(0~10))plt.savefig("./savefig.svg")
plt.show()

plt.plot(NL,a,label = “自己”) ,label后面跟想要显示的字符串,显示中文需要设置字体:plt.legend(prop = ziti),prop参数填上字体路径即可,loc为显示的位置

设置线条风格:

颜色可以使用十六进制,可查颜色表

from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1,2,1,1,1,1,1,1,1,1,1]a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)# 绘制网格
plt.grid(alpha=0.5) # grid 设置网格,alpha=网格透明度(最大为1)plt.plot(NL,a,label = "自己",color = "cyan",linestyle = "--") # abel = 标签,color = 颜色,linestyle = 线条风格,linewidth = 线宽
plt.plot(NL,b,label = "同桌",color = "r",linestyle = ":",linewidth = 6) # 绘制另外一条
plt.legend(prop = ziti,loc = 2) # 设置每条线的标签 plt.legend(prop = 字体路径,loc = 位置(0~10))plt.savefig("./savefig.svg")
plt.show()


小结:

1、对比常用统计图

数据科学库学习第一节相关推荐

  1. 数据科学库学习第二节

    一.绘制散点图 from matplotlib import pyplot as plt # 导入matplotlib模块中的 pyplot类,命名为 plt from matplotlib impo ...

  2. 机器学习-数据科学库(第一天)

    01.数据分析的介绍 什么是数据分析 数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动. 数据分析流程 03.matplotlib的基础绘图 为什么要学习matpl ...

  3. 数据科学导论学习小结——其三

    数据科学导论学习小结--其三 这是笔者大学二年级必修科目<数据科学基础>个人向笔记整理的第三部分,包含第六.第七两个章节.本笔记内容基于清华大学出版社<数据科学导论-探索数据的奥秘& ...

  4. Python 数据科学库入门

    Python 数据科学库入门 1.Numpy 1.1Numpy 简介 Numpy(Numerical Python) Numpy:提供了一个在 Python 中做科学计算的基础库,重在数值计算,主要用 ...

  5. Neoj图数据科学库(The Neo4j graph data science library)使用指南

    目录 介绍 算法 图目录 版本 安装 支持的Neo4j版本 Neo4j Desktop Neo4j Server Enterprise 版本配置 Neo4j Docker Neo4j Causal C ...

  6. 《R数据科学》学习笔记|Note8:使用dplyr处理关系数据

    使用dplyr处理关系数据 往期文章 <R数据科学>学习笔记|Note1:绪论 <R数据科学>学习笔记|Note2:使用ggplot2进行数据可视化(上) <R数据科学& ...

  7. 数据科学导论学习小结——其一

    数据科学导论学习小结--其一 这是笔者大学二年级必修科目<数据科学基础>个人向笔记整理的第一部分,包含前三个章节.本笔记内容基于清华大学出版社<数据科学导论-探索数据的奥秘>的 ...

  8. 机器学习-数据科学库-day6

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 机器学习-数据科学库-day6 pandas学习 动手练习 pandas中的时间序列 生成一段时间范围 关于频率的更多缩写 在Data ...

  9. 机器学习-数据科学库-day5

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 机器学习-数据科学库-day5 pandas学习 pandas之DataFrame pandas常用统计方法 将字符串离散化 数据合并 ...

最新文章

  1. 基于matlab的对流层散射信道特性仿真,对流层散射信道建模和FPGA实现
  2. 工作总结 npoi 模板 导出公式 excel
  3. python真的那么火吗-现在为什么 Python 这么火?
  4. MySql实现sequence功能的代码
  5. PowerDesigner(四)-业务处理模型(转)
  6. 克就克嘛!哪个怕哪个
  7. 01-老马jQuery教程-jQuery入口函数及选择器
  8. c语言做的计算器小程序,c语言实现计算器小程序
  9. [译] Oracle Database 21c 中的 SQL 集合运算符增强功能(EXCEPT、EXCEPT ALL、MINUS ALL、INTERSECT ALL)
  10. gst-launch的-v参数
  11. mysql cluster 分片_MySQL Cluster --01
  12. 小米摄像头有onvif协议_小米8SE、魅族16T、荣耀畅玩9A对比
  13. Word 标题后自动添加分页符、分节符显示与查看
  14. 本地html本地xml文件怎么打开,处理xml文件怎么打开
  15. 应用性能管理APM巅峰对决:skywalking P.K. Pinpoint
  16. 金蝶EAS开发 第一弹:了解开发工具与基本使用(上)
  17. PPT文件不能编辑可以这样解决
  18. idea 双击打不开了咋办
  19. ctfshow 月饼杯(第二届) 部分WriteUp
  20. BUUCTF [FlareOn2]elfie

热门文章

  1. 阿里AI设计师一秒出图,小撒连连惊呼,真相是……
  2. 微信小程序获取当前环境版本
  3. 什么时候 Python 的 List,Tuple 最后一个 Item 后面要加上一个逗号
  4. 爬取前程无忧51job(动态数据)
  5. t12电烙铁c语言程序,T12电烙铁制做分享过程1
  6. HTML5表格介绍以及基本应用
  7. 最长回文子序列 java
  8. MySQL的50条经典语句(更新中...
  9. 第三代酷睿i3处理器_十代酷睿芯片助力!联想ThinkPad 翼14 Slim轻薄本潜能大释放...
  10. 打造专利信息检索平台 服务创新型国家建设