学习python数据分析的30个练手数据+4个数据集网站
前几天发了一个博文:懂点excel作图, 怎么让pyechart作的图更具“职场范“呢?丨pyechart工作作图模板, 一不小心上了热榜, 感谢小伙伴们的支持, 以后会多总结发更好的python数据分析及可视化的文章.
有朋友询问这十几个模板的数据文件, 想必是想实际操作一下, 很不错哟!
我将数据上传到了论坛, 另外分享下工作中收集数据的一些方法!
文章目录
- 12个pyechart模板Excel文件
- 2个数据源
- 4个数据(集)网址
- 1个python公共数据工具包: GoPUP
- 国内生产总值
- 居民消费价格指数
- 千里马公司数据
- 历史上的今天
- 百度实时热门
- 百度今日热点
- 百度百科热词榜
- 微博热搜榜
- 微信热门榜
- 知乎热搜榜
- 知乎热榜
- 豆瓣新片榜
- 豆瓣一周口碑榜
- 汽柴油历史价格信息
- 迁入迁出地详情
- 车站数据
- 列车时刻表
- 全国普通高校名单
12个pyechart模板Excel文件
请点击: 模板数据下载地址
2个数据源
以上数据除了模拟数据外, 其他数据都是来自于网上, 主要是199it数据图表
模块 199it
空气质量数据来自于下面网址, 通过爬虫方式获取
爬虫代码也上传到论坛, 想了解的可以下载: 请点击
爬取的数据作图之前需要进行清洗, 原因是网址的城市名称可能和百度地图收录的城市名称不一致, 需要保持一致, 比如下面这些:
data['城市'].replace('果洛','果洛藏族自治州',inplace=True)
data['城市'].replace('可克达拉','可克达拉市',inplace=True)
4个数据(集)网址
平时可能用到的数据集网址, 分享几个方便初学者学习python。
- 天池数据集
- DC竞赛
- 和鲸社区
- 500强排名数据
1个python公共数据工具包: GoPUP
通过python调用工具包,能获取不少公共信息, 亲测有些接口可能获取不到数据了, 大部分还是可以的!
官网
GoPUP 项目所采集的数据皆来自公开的数据源,不涉及任何个人隐私数据和非公开数据。
安装方式
pip install gopup --upgrade
调用方式
基本上都是几行代码, 返回的是一个dataframe格式数据, 用pandas很容易处理, 适合想学python的朋友学习使用.
import gopup as gp
df_index = gp.weibo_index(word="疫情", time_type="3month")
print(df_index)
国内生产总值
代码
import gopup as gp
df_index = gp.get_gdp_quarter()
df_index
居民消费价格指数
import gopup as gp
df_index = gp.get_cpi()
df_index
千里马公司数据
import gopup as gp
df_index = gp.maxima_company()
df_index
历史上的今天
import gopup as gp
df_index = gp.history_daily()
df_index
百度实时热门
import gopup as gp
df_index = gp.baidu_hot_list()
df_index
百度今日热点
import gopup as gp
df_index = gp.baidu_today_hot_list()
df_index
百度百科热词榜
import gopup as gp
df_index = gp.baidu_hot_word_list()
df_index
微博热搜榜
import gopup as gp
df_index = gp.weibo_hot_search_list()
df_index
微信热门榜
import gopup as gp
df_index = gp.wx_hot_list()
df_index
知乎热搜榜
import gopup as gp
df_index = gp.zhihu_hot_search_list()
df_index
知乎热榜
import gopup as gp
df_index = gp.zhihu_hot_list()
df_index
豆瓣新片榜
import gopup as gp
df_index = gp.douban_movie_list()
df_index
豆瓣一周口碑榜
import gopup as gp
df_index = gp.douban_week_praise_list()
df_index
汽柴油历史价格信息
import gopup as gp
df_index = gp.energy_oil_hist()
df_index
迁入迁出地详情
import gopup as gp
migration_area_baidu_df = gp.migration_area_baidu(area="湖北省", indicator="move_in", date="20200201")
migration_area_baidu_df
车站数据
import gopup as gp
df_index = gp.station_name()
df_index
列车时刻表
import gopup as gp
df_index = gp.train_time_table(train_number="T15")
df_index
全国普通高校名单
import gopup as gp
df_index = gp.university()
df_index
如果这些数据你正好需要, 可以方便调用, 感谢开发提供工具包的朋友!
以上就是这次整理的内容, 欢迎关注, 后期会不断更新!
相关阅读推荐:
1. python小白, 1周入门python数据分析视频课程
2. pyechart可视化18式丨从柱形图的变化, 搞懂pyechart作图套路
3. 懂点excel作图, 怎么让pyechart作的图更具“职场范“呢?
4. 8个常用的python办公室自动化技巧,学会了同事都找你!
5. 学习python数据分析的30个练手数据+4个数据集网站
6. [工作必备]pandas数据分析处理52个常用技巧
7. 泰坦尼克号数据你没见过的可视化丨pyechart制作桑基图(sankey)的最简单方法
8. pyechart制作第七次人口普查数据动态图
学习python数据分析的30个练手数据+4个数据集网站相关推荐
- python数据分析与挖掘实战 配套资源_[课程学习]Python数据分析与挖掘实战 配套完整数据和源代码 rar文件[25.46MB]-码姐姐下载...
该资源为<python数据分析与挖掘实战>一书的配套的资源代码,鉴于大多数读者很难找到此资源,特此分... 大小:20.99MB | 2020-05-14 19:07:04 本资源是pyt ...
- 『对比Excel,轻松学习Python数据分析』新书发布
之前在公众号提过,我写了一本书,现在这本书终于面世了,这本书就是『对比Excel,轻松学习Python数据分析』,这本书是写什么的,以及这本书怎么写的,相信大家通过书名就能了解一二,但还是有必要专门写 ...
- python和excel的区别-对比Excel,轻松学习Python数据分析
阅读权限50威望2 级论坛币2119 个学术水平357 点热心指数383 点信用等级313 点经验103301 点帖子917精华在线时间8677 小时注册时间2012-3-28最后登录2020-10- ...
- 好书推荐:《对比Excel,轻松学习Python数据分析》
之前就一直有打算出一个结合Excel的Python数据分析的教程,刚好张俊红同学就出了书籍,后面写相关文章又多了一本好书.我首先说说我的看法,为什么要和Excel做结合了. Excel大家都熟悉,结合 ...
- 为什么学习Python数据分析
为什么学习Python数据分析?这是很多人都比较关注的一个问题,Python编程语言近几年在互联网行业是非常火爆的,尤其是在人工智能这一领域,它会大大的提高我们的工作效率等等,具体来看看下面的详细介绍 ...
- 怎么学python-如何轻松学习Python数据分析
1.实际的工作 如果你是一名数据分析师,我相信你对上面的这些词应该不陌生.我自己在刚开始做数据分析的时候,基本上每天就是Excel,就是Excel里面的vlookup.sumifs.数据透视表这些,s ...
- 如何自学python数据分析-良心整理!学习Python数据分析的正确姿势
学习 Python 数据分析的正确姿势 如果你是通过学习给程序员设计的 Python 课程来学习 Python 数据分析,那就大错特错了.很多数据分析师在开始学习 Python 数据分析之前就被引导学 ...
- 如何自学python数据分析-如何轻松学习Python数据分析?
今天这篇文章来聊聊如何轻松学习『Python数据分析』,我会以一个数据分析师的角度去聊聊做数据分析到底有没有必要学习编程.学习Python,如果有必要,又该如何学习才能做到毫不费力. 1. 实际的工作 ...
- python 数据分析学什么-如何学习Python数据分析呢?老男孩Python培训
数据分析是大数据的重要组成部分,在越来越多的工作中都扮演着重要的角色,Python可以利用各种Python库,如NumPy.pandas.matplotlib以及IPython等,高效的解决各式各样的 ...
最新文章
- 【学习笔记】7、标准数据类型—字符串
- ResNet最强改进版来了!ResNeSt:Split-Attention Networks
- hadoop2.x的变化
- 【C语言】创建一个函数,利用该函数将字符串中的小写字母转换为大写字母
- 两个mapreduce 做topn_hadoop分布式计算MapReduce详细总结
- css里calculate,css3 calc会计算的属性
- 最近很火的数据动图python_12个流行的Python数据可视化库总结
- 1.2 案例:波士顿房价预测
- MyBatis学习笔记(4)-resultMap多对多映射使用总结
- 【学习笔记】bootstrap之CSS组件
- IDEA的插件和一些主题推荐
- STM32制作flash烧写器 spi flash
- android 软件搬家 换机,手机搬家一键换机
- python中复选框取消修改_Python tkinter复选框双重检查/取消选中(Python tkinter Checkboxes double check/uncheck)...
- origin2018 柱状图_学术干货 | 科研人请收藏—Origin画出双Y轴柱状图
- python迭代对象是什么意思_python的迭代对象
- stl文件用proe怎么打开_3dMax怎么导入proe的文件渲染?3dmax导入stl文件过程
- Android编译自定义sdk,向Android SDK中添加自定义的库 (Addon)
- 微软拥抱开源_拥抱开源作为视觉艺术家
- 去重的几种方法(部分)