数据科学库学习第一节
一、数据分析和介绍
二、认识jupyter notebook
打开Anaconda:
win + R打开运行,输入cmd进入命令提示符
在命令提示符内输入 jupyter notebook 即可打开
创建文件夹
勾选中后可进行移动和重命名操作
并非.py格式
三、matplotlib模块
from matplotlib import pyplot as plt # 导入matplotlib模块中的 pyplot类,命名为 pltx = range(2,26,2) # 定义x轴
y = [15,13,14.5,17,20,25,25,26,27,22,18,15] # 定义y轴plt.plot(x,y) # 绘制
plt.show() # 显示
1、设置显示图片大小和保存当前图片
from matplotlib import pyplot as plt # 导入matplotlib模块中的 pyplot类,命名为 pltx = range(2,26,2) # 定义x轴
y = [15,13,14.5,17,20,25,25,26,27,22,18,15] # 定义y轴
# 图片大小设置
plt.figure(figsize=(20,8),dpi=100) # figure(figsize=(横,纵),dpi=数值越大越清晰)
plt.plot(x,y) # 绘制
# 保存
plt.savefig("./savefig.png")
plt.show() # 显示
svg格式:
2、调整x或y轴的刻度
from matplotlib import pyplot as plt # 导入matplotlib模块中的 pyplot类,命名为 pltx = range(2,26,2) # 定义x轴
y = [15,13,14.5,17,20,25,25,26,27,22,18,15] # 定义y轴
# 图片大小设置
plt.figure(figsize=(20,8),dpi=100) # figure(figsize=(横,纵),dpi=数值越大越清晰)
plt.xticks(x) # 会根据给到的列表一一绘制出点位
plt.plot(x,y) # 绘制
# 保存
plt.savefig("./savefig.svg")
plt.show() # 显示
可以使用列表推导式来生成自己想要的列表
x = range(2,26,2) # 定义x轴
y = [15,13,14.5,17,20,25,25,26,27,22,18,15] # 定义y轴
# 图片大小设置
plt.figure(figsize=(20,8),dpi=100) # figure(figsize=(横,纵),dpi=数值越大越清晰)
new_x = [a/2 for a in range(4,50)] # 可以用列表推导式生成想要的列表
plt.xticks(new_x) # 会根据给到的列表一一绘制出点位
plt.plot(x,y) # 绘制
# 保存
plt.savefig("./savefig.svg")
plt.show() # 显示
from matplotlib import pyplot as plt
import random
a = [random.randint(20,35) for i in range(120)]
new_x = [A for A in range(1,121)]
plt.figure(figsize=(45,5),dpi=100)
plt.xticks(new_x)
plt.yticks(a)
plt.plot(new_x,a)
plt.savefig("./savefig.svg")
plt.show()
未截取全部(图片过长)
汉字显示:
显示汉字时需要先设置一下字体,否则会报错
# 设置字体
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7) # 设置字体(需要导入matplotlib模块中的font_manager):font_manager.FontProperties(fname=r"字体路径",size=字体大小)
from matplotlib import pyplot as plt
import random
from matplotlib import font_manager
y = [random.randint(20,35) for i in range(120)]
new_x = range(0,120)
new_xx = new_x# 设置字体
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=10) # 设置字体(需要导入matplotlib模块中的font_manager):font_manager.FontProperties(fname=r"字体路径",size=字体大小)new_x2 = ["10点{0}分".format(A) for A in range(60)] # 设置x轴字体,由于一个小时只有60分所以将120分拆开成2小时(列表)
new_x2 += ["11点{0}分".format(A) for A in range(60)]plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
plt.xticks(new_x[::4],new_x2[::4],rotation= -45,fontproperties = ziti) # plt.xticks(数字(时间),汉字(时间),rotation= 旋转角度,fontproperties = 字体)plt.plot(new_x,y)
plt.savefig("./savefig.png")
plt.show()
对x轴,y轴和整体做一个单独的标签 x/ylabel() ;title():
from matplotlib import pyplot as plt
import random
from matplotlib import font_manager
y = [random.randint(20,35) for i in range(120)]
new_x = range(0,120)
new_xx = new_x# 设置字体
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7) # 设置字体(需要导入matplotlib模块中的font_manager):font_manager.FontProperties(fname=r"字体路径",size=字体大小)new_x2 = ["10点{0}分".format(A) for A in range(60)] # 设置x轴字体,由于一个小时只有60分所以将120分拆开成2小时(列表)
new_x2 += ["11点{0}分".format(A) for A in range(60)]plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
plt.xticks(new_x[::4],new_x2[::4],rotation= -45,fontproperties = ziti) # plt.xticks(数字(时间),汉字(时间),rotation= 旋转角度,fontproperties = 字体)# 标签
plt.xlabel("时间",fontproperties = ziti) # 一定要设置字体否则输出中文会报错
plt.ylabel("温度",fontproperties = ziti) # 一定要设置字体否则输出中文会报错
plt.title("10点到12点的每分钟变化",fontproperties = ziti) # 一定要设置字体否则输出中文会报错plt.plot(new_x,y)
plt.savefig("./savefig.svg")
plt.show()
from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)
plt.plot(NL,a)
plt.savefig("./savefig.svg")
plt.show()
绘制网格grid():
from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)# 绘制网格
plt.grid(alpha=0.5) # grid 设置网格,alpha=网格透明度(最大为1)plt.plot(NL,a)
plt.savefig("./savefig.svg")
plt.show()
from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1,2,1,1,1,1,1,1,1,1,1]a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)# 绘制网格
plt.grid(alpha=0.5) # grid 设置网格,alpha=网格透明度(最大为1)plt.plot(NL,a)
plt.plot(NL,b) # 绘制另外一条plt.savefig("./savefig.svg")
plt.show()
为每条线标上标签:
from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1,2,1,1,1,1,1,1,1,1,1]a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)# 绘制网格
plt.grid(alpha=0.5) # grid 设置网格,alpha=网格透明度(最大为1)plt.plot(NL,a,label = "自己")
plt.plot(NL,b,label = "同桌") # 绘制另外一条
plt.legend(prop = ziti,loc = 2) # 设置每条线的标签 plt.legend(prop = 字体路径,loc = 位置(0~10))plt.savefig("./savefig.svg")
plt.show()
plt.plot(NL,a,label = “自己”) ,label后面跟想要显示的字符串,显示中文需要设置字体:plt.legend(prop = ziti),prop参数填上字体路径即可,loc为显示的位置
设置线条风格:
颜色可以使用十六进制,可查颜色表
from matplotlib import pyplot as plt
from matplotlib import font_managera = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1,2,1,1,1,1,1,1,1,1,1]a1 = ["{}位".format(A) for A in a]
ziti = font_manager.FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf",size=7)plt.figure(figsize=(20,5),dpi=100) # 设置图片大小dpi
NL = range(11,31)
NL1 = ["{0}岁".format(A) for A in range(11,31)]plt.xticks(NL,NL1,fontproperties = ziti) # 显示汉字的话要传入两个参数:需要显示的数据,所对应的字符串
plt.yticks(a,a1,fontproperties = ziti)# 绘制网格
plt.grid(alpha=0.5) # grid 设置网格,alpha=网格透明度(最大为1)plt.plot(NL,a,label = "自己",color = "cyan",linestyle = "--") # abel = 标签,color = 颜色,linestyle = 线条风格,linewidth = 线宽
plt.plot(NL,b,label = "同桌",color = "r",linestyle = ":",linewidth = 6) # 绘制另外一条
plt.legend(prop = ziti,loc = 2) # 设置每条线的标签 plt.legend(prop = 字体路径,loc = 位置(0~10))plt.savefig("./savefig.svg")
plt.show()
小结:
1、对比常用统计图
数据科学库学习第一节相关推荐
- 数据科学库学习第二节
一.绘制散点图 from matplotlib import pyplot as plt # 导入matplotlib模块中的 pyplot类,命名为 plt from matplotlib impo ...
- 机器学习-数据科学库(第一天)
01.数据分析的介绍 什么是数据分析 数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动. 数据分析流程 03.matplotlib的基础绘图 为什么要学习matpl ...
- 数据科学导论学习小结——其三
数据科学导论学习小结--其三 这是笔者大学二年级必修科目<数据科学基础>个人向笔记整理的第三部分,包含第六.第七两个章节.本笔记内容基于清华大学出版社<数据科学导论-探索数据的奥秘& ...
- Python 数据科学库入门
Python 数据科学库入门 1.Numpy 1.1Numpy 简介 Numpy(Numerical Python) Numpy:提供了一个在 Python 中做科学计算的基础库,重在数值计算,主要用 ...
- Neoj图数据科学库(The Neo4j graph data science library)使用指南
目录 介绍 算法 图目录 版本 安装 支持的Neo4j版本 Neo4j Desktop Neo4j Server Enterprise 版本配置 Neo4j Docker Neo4j Causal C ...
- 《R数据科学》学习笔记|Note8:使用dplyr处理关系数据
使用dplyr处理关系数据 往期文章 <R数据科学>学习笔记|Note1:绪论 <R数据科学>学习笔记|Note2:使用ggplot2进行数据可视化(上) <R数据科学& ...
- 数据科学导论学习小结——其一
数据科学导论学习小结--其一 这是笔者大学二年级必修科目<数据科学基础>个人向笔记整理的第一部分,包含前三个章节.本笔记内容基于清华大学出版社<数据科学导论-探索数据的奥秘>的 ...
- 机器学习-数据科学库-day6
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 机器学习-数据科学库-day6 pandas学习 动手练习 pandas中的时间序列 生成一段时间范围 关于频率的更多缩写 在Data ...
- 机器学习-数据科学库-day5
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 机器学习-数据科学库-day5 pandas学习 pandas之DataFrame pandas常用统计方法 将字符串离散化 数据合并 ...
最新文章
- 基于matlab的对流层散射信道特性仿真,对流层散射信道建模和FPGA实现
- 工作总结 npoi 模板 导出公式 excel
- python真的那么火吗-现在为什么 Python 这么火?
- MySql实现sequence功能的代码
- PowerDesigner(四)-业务处理模型(转)
- 克就克嘛!哪个怕哪个
- 01-老马jQuery教程-jQuery入口函数及选择器
- c语言做的计算器小程序,c语言实现计算器小程序
- [译] Oracle Database 21c 中的 SQL 集合运算符增强功能(EXCEPT、EXCEPT ALL、MINUS ALL、INTERSECT ALL)
- gst-launch的-v参数
- mysql cluster 分片_MySQL Cluster --01
- 小米摄像头有onvif协议_小米8SE、魅族16T、荣耀畅玩9A对比
- Word 标题后自动添加分页符、分节符显示与查看
- 本地html本地xml文件怎么打开,处理xml文件怎么打开
- 应用性能管理APM巅峰对决:skywalking P.K. Pinpoint
- 金蝶EAS开发 第一弹:了解开发工具与基本使用(上)
- PPT文件不能编辑可以这样解决
- idea 双击打不开了咋办
- ctfshow 月饼杯(第二届) 部分WriteUp
- BUUCTF [FlareOn2]elfie
热门文章
- 阿里AI设计师一秒出图,小撒连连惊呼,真相是……
- 微信小程序获取当前环境版本
- 什么时候 Python 的 List,Tuple 最后一个 Item 后面要加上一个逗号
- 爬取前程无忧51job(动态数据)
- t12电烙铁c语言程序,T12电烙铁制做分享过程1
- HTML5表格介绍以及基本应用
- 最长回文子序列 java
- MySQL的50条经典语句(更新中...
- 第三代酷睿i3处理器_十代酷睿芯片助力!联想ThinkPad 翼14 Slim轻薄本潜能大释放...
- 打造专利信息检索平台 服务创新型国家建设