Python数据爬取之中国人口数据【附整理好的分省数据下载链接】
这篇文章用pandas
对全球的人口数据做个简单分析。我收集全球各国1960-2019年人口数据,包含男女和不同年龄段,共6个文件。
pop_total.csv: 各国每年总人口
pop_female.csv:各国每年女性人口
pop_male.csv: 各国每年男性人口
pop_0_14.csv: 各国每年0-14岁人口
pop_15_64.csv: 各国每年15-64岁人口
pop_65up.csv:各国每年65岁以上人口
先用pandas
读取文件数据
import pandas as pdpop_total = pd.read_csv('./data/pop_total.csv', skiprows=4)
pop_total.info()
pop_total.csv
文件存放各国每年总人口数据,格式如下
pop_total.head(2)
同样的方式,我们读取剩下的5个文件,对应的DataFrame
分别是pop_female
、pop_male
、pop_0_14
、pop_15_64
、pop_65up
。
为了直观观察全球人口分布,我们用pyecharts
绘制2019年全球人口分布地图
from pyecharts
Python数据爬取之中国人口数据【附整理好的分省数据下载链接】相关推荐
- python爬虫爬取(中国空气质量在线监测分析平台)北京PM2.5,2013年至2018年的数据
要爬取的数据网站如下图所示: 即是爬取该网站2013年12月2日至2018年11月份北京空气质量指数历史数据,其中要爬起的 内容如PM2.5,So2等,即是从这个网页内置的表格中爬取,因为该网站比较有 ...
- Python编曲实践(五):通过编写爬虫来爬取海量MIDI文件,预备构建数据集(附有百度云下载链接)
前言 由于毕业设计的课题是通过CycleGAN搭建一个音乐风格转换系统,需要大量的音乐文件来训练神经网络,而MIDI文件作为最广泛使用的一种电脑编曲保存媒介,十分容易搜集资源,也有很多成熟的Pytho ...
- 每日一练:Python国内疫情数据爬取与地图绘制
Python 国内疫情数据爬取与地图绘制 效果图 累计确诊疫情地图绘制 ① 时时数据抓取 ② 获取省份疫情数据 ③ 视觉配置项分段颜色数据设置 ④ 累计确诊疫情地图绘制 现存确诊疫情地图绘制 ① 获取 ...
- 搜狗·疫情数据爬取(Python)
上周已经分享过搜狗·疫情数据爬取(R语言),这次分享一下搜狗·疫情数据爬取(Python) 不说废话,直接上代码.有什么问题,可以在留言区讨论. from urllib import request ...
- 十年电影票房数据爬取与分析 | 免费数据教程
3月8日妇女节,我很期待的超级英雄电影<惊奇队长>上映了,票房表现很快过亿,但大众口碑却让人失望. 一个有趣且常见的现象是,隔壁获奖无数,口碑爆炸的<绿皮书>,票房却远远不如& ...
- 基金数据爬取与分析评估
对量化投资感兴趣的朋友,可关注微信公众号:Quant_Reserch ,与我们交流.公众号中有每日的复盘,研究策略分享. 目录 基金数据爬取 代码 遇到的坑 基金数据分析 代码 结果分析 基金数据爬取 ...
- 微博话题下的数据爬取
1.前言 新浪微博中,一个话题下各个媒体或用户发表在平台发表的信息是舆情研究的一个很重要的数据来源,这里记录一下一个话题下数据的爬取方式,以"#美国疫情#"话题为例. 2.话题下数 ...
- python自动爬取更新电影网站_python爬取电影网站信息
一.爬取前提 1)本地安装了mysql数据库 5.6版本 2)安装了Python 2.7 二.爬取内容 电影名称.电影简介.电影图片.电影下载链接 三.爬取逻辑 1)进入电影网列表页, 针对列表的ht ...
- python爬取天猫,python如何爬取天猫店铺商品链接?
在使用python爬虫爬取网页时会遇到很多含有特殊符号的情况,当把链接复制到浏览器打开,发现每个节点都多了个\,直接使用response.xpath()无法定位元素,为避免定位不到元素的问题,应先对响 ...
最新文章
- 阿里云PolarDB数据库将云原生进行到底!业内首次实现三层池化
- R语言与非参数检验之两独立样本中位数检验
- Android MediaPlayer使用方法简单介绍
- 【Java】基于Socket的C/S聊天程序
- 《你不常用的c#之二》:略谈GCHandle
- 关于function
- SpringBoot数据访问-------------数据缓存
- 什么是偏振光和UV光?
- 浙江概况——经济发展篇
- dubbo实战之四:管理控制台dubbo-admin
- 便笺Sticky note常用快捷键
- noip2016普及组初赛中山市成绩表及分数线
- CDH主机网络接口似乎未以全速运行
- 科学松鼠会压缩感知科普文章两篇:“压缩感知与单像素相机(陶哲轩)”“填补空白:用数学方法将低分辨率图像变成高分辨率图像(Jordan Ellenberg)
- SpringMVC参数值的传递(参数接收,数组接收,模型接收,多个模型接收以及数据回显,批量操作)
- 制作一个惊艳所有人的计算器
- lammps和atomsk中常用的建模方法
- Xcode 7 Bitcode的工作流程及安全性评估
- 什么是商业模式(Business Model)?
- 2005年九大受宠技术:HSDPA
热门文章
- 报表解决方案Telerik Reporting发布R2 2019 SP1|支持MS Access
- 金蝶K3开发-工业老单据序时薄增加过滤条件
- poi操作word实现分页
- U盘产生快捷方式病毒
- cad怎么将图层后置_cad怎么把整个图层置于底层
- Unity3D 实现背包系统
- 「镁客早报」OneWeb顺利发射首批6颗互联网卫星;华为西欧负责人称公司将会获得德国5G合同...
- python实现视频ai换脸_Python如何实现AI换脸功能 Python实现AI换脸功能代码
- EFCore:关于DDD中值对象(Owns)无法更新数值
- 80核处理器_最受欢迎的处理器 酷睿i5-9400F果然霸榜了