Python应用实战-Python爬取4000+股票数据,并用plotly绘制了树状热力图(treemap)
目录:
1. 准备工作
2. 开始绘图
2.1. 简单的例子
2.2. px.treemap常用参数介绍
2.3. color_continuous_scale参数介绍
2.4. 大A股市树状热力图来了
2.5. plotly图片存本地
1. 准备工作
我这边是在jupyterlab中演示的plotly图表,如果只安装plotly是无法正常显示图表的(会显示为空白),我们需要进行以下准备(以下命令均在cmd下操作即可):
# 安装plotly库及plotly-orca库
pip install plotly
pip install plotly plotly-orca# Basic JupyterLab renderer support
jupyter labextension install jupyterlab-plotly# OPTIONAL: Jupyter widgets extension for FigureWidget support
jupyter labextension install @jupyter-widgets/jupyterlab-manager plotlywidget
参考:https://github.com/plotly/plotly.py
关于本文用到的数据呢,大家可以参考《python爬取股票最新数据并用excel绘制树状图》的爬虫代码自行爬取,或者公众号回复0302
获取哈!
2. 开始绘图
Treemap绘制方式有两种,一种是在plotly.express
下,一种是在go.Treemap
下,我们这里用到的是前者。至于其中的区别,大概就是前者是高级版本,封装了很多后者的复杂操作,可以直接用pandas.Dataframe类型,是现在主推的。更多差异大家可自行在实践过程中感悟,毕竟才哥也说不太明白!
2.1. 简单的例子
plotly自带很多测试数据,我们用其中一个才试试简单的。
import plotly.express as pxdf = px.data.tips()
df.head()
px.data.tips()
以上数据大致就是星期几什么餐不同性别的人支付的金额和小费数等,我们用1行代码绘制简单的treemap如下:
fig = px.treemap(df, path=['day', 'time', 'sex'], values='total_bill')
fig.show()
简单的图
可以看到在该树状图中,层级依次是在path
中顺序的day、time和sex,而每个色块面积大小就是values
给定的total_bill。鼠标悬停的时候,会出现更详细的信息,毕竟plotly是可交互式的,这里不展开哈。
那么,px.treemap究竟还可以做什么呢?我们继续往下看。
2.2. px.treemap常用参数介绍
让我们直接在jupyterlab用?来获取函数参数吧!
# px.treemap?# Signature:
px.treemap(data_frame=None, # 就是你要用到的数据,names=None, # 暂时不用values=None, # 就是你色块大小parents=None, # 暂时也不用,和names组合出现吧ids=None, # 暂时不用,后续暂时不用的字段我就不写啦path=None, # 层级,依次排开color=None, # 颜色,比如根据 涨跌幅字段来设置颜色color_continuous_scale=None, # 自带的颜色尺卡,后面会介绍range_color=None, # 颜色范围区间,超过就是两端值color_continuous_midpoint=None, # 颜色尺卡最中间 的值,比如涨跌幅中间设置为 0 最合适color_discrete_sequence=None, color_discrete_map=None,hover_name=None,hover_data=None, # 就是悬停时 显示字段及其格式custom_data=None, # 额外的想显示的数据labels=None,title=None, # 标题咯template=None,width=None, # 图高height=None, # 图长branchvalues=None,maxdepth=None,
)
对于更多参数的了解,大家可以自己 ?
后看哈,蛮详细的,就是纯英文的我自己看着要结合翻译软件也蛮累。
2.3. color_continuous_scale参数介绍
上面我们提到过该参数为 我们 treemap图色块颜色使用的色卡,具体有哪些可选以及这些可选项都是啥样呢?
我们在?
里找到了方向:
color_continuous_scale: list of strStrings should define valid CSS-colors This list is used to build acontinuous color scale when the column denoted by `color` containsnumeric data. Various useful color scales are available in the`plotly.express.colors` submodules, specifically`plotly.express.colors.sequential`, `plotly.express.colors.diverging`and `plotly.express.colors.cyclical`.
我们在jupyterlab里调用里面提到的方法,很开心的发现了它们:
import plotly
# 大家不要急,一个个来,我这里预览只截取了diverging的部分
plotly.express.colors.cyclical.swatches()
plotly.express.colors.sequential.swatches()
plotly.express.colors.diverging.swatches()
diverging
由于在我们国家,绿色代表跌,红色代表涨,寻觅了半天我选取了Geyser
,当然大家亦可自行选择。
推荐选项
2.4. 大A股市树状热力图来了
基于以上的了解,发现差不多可以绘制图了,那么来吧!
import plotly.express as pxfig = px.treemap(df, path=['板块', '企业名称',], # 指定层次结构,每一个层次都应该是category型的变量values='市值(亿)', # 需要聚合的列名color='涨幅', range_color = [-0.05, 0.05], # 色彩范围最大最小值hover_data= {'涨幅':':.2%','市值(亿)':':.2f'}, # 鼠标悬浮显示数据的格式height = 1080,width = 1920,color_continuous_scale='Geyser',color_continuous_midpoint=0 , # 颜色变化中间值设置为增长率=0)
fig.update_traces(textinfo='label+value',textfont = dict(size = 24)) # 显示企业名称和市值,字体24
fig.show()
效果演示
2.5. plotly图片存本地
这里是指图片哦,不是html文件哈!
大家还记得我们在准备工作中 安装orca
,没事,不记得的话,重新装一下就行了。
pip install plotly plotly-orca
对于我们绘制好的plotly图表对象,以下方式可以进行本地保存。
import plotly.io as piopio.write_image(fig, '树状云图png')
当然,要是觉得麻烦,其实你还可以直接点击图表最右上角的摄像头进行下载哈!
Python应用实战-Python爬取4000+股票数据,并用plotly绘制了树状热力图(treemap)相关推荐
- 我用Python爬取了4000+股票数据,并用plotly绘制了树状热力图(treemap)
大家好,我是辰哥~ 在最近学习plotly中,让我在高级图表里发现了treemap,居然可以很好地绘制全部4000+股票树状热力图,大家看以下就是最终效果图,是不是很赞! 大A头部公司股价又绿晕了啊 ...
- python爬取豆瓣影评_【python爬虫实战】爬取豆瓣影评数据
概述: 爬取豆瓣影评数据步骤: 1.获取网页请求 2.解析获取的网页 3.提速数据 4.保存文件 源代码: # 1.导入需要的库 import urllib.request from bs4 impo ...
- Python爬虫实战之爬取QQ音乐数据
目录 准备工作 安装方法 步骤 新建py文件 复制网页链接 获取源代码 获取数据 源代码 这里用QQ音乐作为一个例子.不同的链接,按照此方法都可做到. 本次程序编写原则上按照模块化进行划分,一个步骤一 ...
- Python爬虫实战之爬取QQ音乐数据!QQ音乐限制太多了!
这里用QQ音乐作为一个例子.不同的链接,按照此方法都可做到. 本次程序编写原则上按照模块化进行划分,一个步骤一个函数. 分别:main().open_url(url).find_attribute() ...
- 携程ajax,Python爬虫实战之爬取携程评论
一.分析数据源 这里的数据源是指html网页?还是Aajx异步.对于爬虫初学者来说,可能不知道怎么判断,这里辰哥也手把手过一遍. 提示:以下操作均不需要登录(当然登录也可以) 咱们先在浏览器里面搜索携 ...
- Python爬虫实战之爬取糗事百科段子
Python爬虫实战之爬取糗事百科段子 完整代码地址:Python爬虫实战之爬取糗事百科段子 程序代码详解: Spider1-qiushibaike.py:爬取糗事百科的8小时最新页的段子.包含的信息 ...
- Python爬虫实战之爬取百度贴吧帖子
Python爬虫实战之爬取百度贴吧帖子 大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标 对百度贴吧的 ...
- 用Python爬取最新股票数据含完整源代码
用Python爬取最新股票数据含完整源代码 抓取目标: url:http://webapi.cninfo.com.cn/#/marketDataDate 数据目标: 获取 证券代码 证券简称 交易日期 ...
- Python爬虫实战(1) | 爬取豆瓣网排名前250的电影(下)
在Python爬虫实战(1) | 爬取豆瓣网排名前250的电影(上)中,我们最后爬出来的结果不是很完美,这对于"精益求精.追求完美的"程序猿来说怎么能够甘心 所以,今天,用pyth ...
最新文章
- 题目1028:继续畅通工程
- JS 获取指定时间的时间戳(兼容各个浏览器)
- Java并发编程——volatile
- NULL 值处理遇到的错误问题.
- (5) 百度2011研发工程师笔试卷
- C++学习笔记(二)——交换函数(swap)
- 如何将markdown转换为wxml
- Python反射和内置方法(双下方法)
- 使用RoboCopy 命令
- MS08-067漏洞渗透测试
- 交换机日志删除_锐捷交换机记录日志到flash功能详解 | 19号系统
- matlab求内切圆,MATLAB求图形的最大内切圆代码
- 汽车百科系列之(十一): 汽车天窗是干嘛用的
- 天猫精灵 python_天猫精灵控制esp8266点led灯
- 新版本微信分享sdk(1.8.3)踩坑实录
- (转)Visual SourceSafe (VSS的使用方法)使用方法
- 一 MATLAB学习之axis函数总结
- clearcase下的一些常用命令
- android-历史版本
- Unity之UGUI详解