人口数据是我们在各项研究中最常用的数据之一。人口数据的主要来源是我国每十年进行一次的人口普查,最近一次的人口普查是2020年进行的第七次人口普查,简称七普!

之前我们介绍了《2020中国人口普查分县资料》的表1—人口基本状况(可以查看之前的文章)!今天我们来介绍表2——分年龄、性别的人口!该表统计了不同年龄段的男性和女性人口!年龄段包括:0岁、1-4岁、5-9岁、10-14岁、15-19岁、20-24岁、25-29岁、30-34岁、35-39岁、40-44岁、45-49岁、50-54岁 、55-59岁、60-64岁、65-69岁、70-74岁、75-79岁、80-84岁、85岁及以上。再次说明的是以上年龄段均统计有男性人口和女性人口!

可视化展示

1.省份的分年龄、性别的人口

我们以全国各省份的85及以上的男性人口85及以上的女性人口两个指标为例来预览下,数据不包括港澳台,剩下的所有省份均有数据,如下图:

全国各省份的85岁及以上的男性人口 

全国各省份的85岁及以上的女性人口

2.地级市的分年龄、性别的人口

我们以全国各地级市的40-44岁的男性人口40-44岁的女性人口两个指标为例来预览下,数据不包括港澳台,剩下的所有地级市均有数据,如下图:

全国各地级市的40-44岁的男性人口

全国各地级市的40-44岁的女性人口

3.区县的分年龄、性别的人口

我们以全国各区县的20-24岁的男性人口20-24岁的女性人口两个指标为例来预览下,数据不包括港澳台,剩下的所有区县均有数据,如下图:

全国各区县的20-24岁的男性人口

全国各区县的20-24岁的女性人口

整理过程说明

本数据来源于《2020中国人口普查分县资料》,想得到最终的excel和shp数据,需要做两个工作,第一个是将数据电子化,形成excel格式的数据第二个是将excel数据矢量化,得到shp格式的数据!

对于将PDF电子化,主要是要选择合适的视图软件,在识别后要对识别错误的数据进行修改,比如错误的符号,错误的字母等,最后还要对数据进行检查,比如可以通过总人口是否等于男性人口+女性人口来检查这三列数据有没有错误!

我们重点来看一下第二步——将excel数据矢量化,得到shp格式的数据!对于将excel矢量化成shp数据,我们需要首先找到一个高精度的全国省市县的行政区划shp数据,有了行政区划数据,下一步的重点工作是将excel数据根据公共列(省名称、城市名称、区县名称)链接到行政区划shp数据里面,这一步会有很多错误,需要一一检查,我们依次来看一下!

1.将省份层级的excle数据矢量化形成shp数据

由于我国只有34个省级行政单元,excel数据和shp数据里面的省份名称是完全对应的,我们不用经过任何处理,使用arcgis中的连接功能,以省份名称为连接列,直接链接就能得到最终的数据!该数据除了港澳台地区以外,没有任何缺失值!

2.将地级市层级的excle数据矢量化形成shp数据

我国有300多个地级市行政单元,这300多个行政单元的名称都是唯一的,没有重复,所以也可以直接连接得到最终的数据!该数据除了港澳台地区以外,没有任何缺失值!

3.将区县层级的excle数据矢量化形成shp数据

相比于省份层级和地级市层级,区县等级的处理要复杂的多,需要大量的工作!主要包括如下几个方面:

①我国的区县名称并不是唯一的,比如全国有四个城市有鼓楼区,有两个城市有朝阳区,有两个城市有宝山区,全国重复的区县名称大约有60个,对于这些区县,如果直接根据区县名称进行连接会出错,需要一一进行处理,这儿的处理方式是将区县前面的城市和省份加上,这样区县名称就是唯一的啦,就可以进行连接了!

②通过各种渠道获取的行政区划shp数据虽然精度很高,但是依然有一些和基于《2020中国人口普查分县资料》整理的excel数据不对应的区县!这儿分为两种情况,第一种是有些已经调整的区划,行政区划shp数据里面没有跟着调整,对于这样的问题,我们以以excel数据为准,对行政区划shp数据进行调整,包括:

  • 河北省邢台市进行了行政区划大调整,桥西区改为了信都区,桥东区改为了襄都区等,在这儿就不一一列举了,对行政区划shp数据进行相应调整;
  • 海西蒙古族藏族自治州直辖改为海西蒙古族藏族自治州大柴旦行政委员会
  • 南沙市改为南沙群岛
  • 烟台蓬莱市和长岛县合并为蓬莱区
  • 成都新津县改为新津区
  • 江西省龙南县改为龙南市

另外,在《2020中国人口普查分县资料》中还统计有大约100个地区在行政区划shp数据里面没有包括,比如比如石家庄高新技术产业开发区、河北唐山芦台经济开发区、唐山市汉沽管理区、荆州经济技术开发区济南高新技术产业开发区等!我们观察下来这些数据基本都是开发区、产业园区,而行政区划shp数据里面没有统计这些开发区、产业园区!对于这些开发区也很难找到精确的行政边界,所以在最终的shp数据中我们直接忽略了这些数据。excel版本的数据中是包括了这些开发区、产业园区的,大家如果想要使用这些数据请使用excel数据,特此说明!

文末下方是我们的公众号名片,我们将定期介绍各类城市数据以及数据的可视化和分析技术,有关2020年第七次人口普查指标数据的更多详情,欢迎大家多多关注我们进行了解~

【2020年第七次人口普查】省市县三级分年龄、性别的人口相关推荐

  1. 【五六七人口普查】省市两级分年龄、性别的人口

    人口数据常用于各项研究中!之前我们介绍过第七次人口普查(简称七普)的人口数据!很多小伙伴咨询有没有前面几次人口普查指标数据的介绍,这样方便做人口变化分析!本次我们特地整理了五普.六普的人口数据指标,加 ...

  2. 魔兽世界9.5人口最多服务器,魔兽世界最新全球服务器人口普查,国服早已不是世界第一人口大服...

    原标题:魔兽世界最新全球服务器人口普查,国服早已不是世界第一人口大服 众所周知,魔兽世界国服在辉煌的年代玩家人口数量的非常多的,然而随着魔兽世界的人气日渐衰落,国服玩家人数也迅速下降,到了月卡时代更是 ...

  3. 2021成都四七九高考成绩查询,2020成都四七九高考战果汇总,三校七区谁最强?绝对出乎你的意料~...

    原标题:2020成都四七九高考战果汇总,三校七区谁最强?绝对出乎你的意料~ 作为成都教育的金字招牌,今年四七九高考战果如何?我整理了四七九三校七区的今年出口以及2017年中考收分情况,给大家做个参考. ...

  4. 第七次全国人口普查公报[1](第四号) ——人口性别构成情况

    来源:国家统计局发布时间:2021-05-11 10:00 国家统计局 国务院第七次全国人口普查领导小组办公室 2021年5月11日 根据第七次全国人口普查结果,现将2020年11月1日零时我国大陆3 ...

  5. 【2020年第七次人口普查】省市县三级人口婚姻状况和妇女生育状况

    人口数据是我们在各项研究中最常用的数据之一.人口数据的主要来源是我国每十年进行一次的人口普查,最近一次的人口普查是2020年进行的第七次人口普查,简称七普!很多小伙伴对七普数据翘首以盼,最近<2 ...

  6. 【2020年第七次人口普查】省市县三级人口基本情况

    人口数据是我们在各项研究中最常用的数据之一.人口数据的主要来源是我国每十年进行一次的人口普查,最近一次的人口普查是2020年进行的第七次人口普查,简称七普! 本次我们所介绍的是<2020中国人口 ...

  7. 【2020年第七次人口普查】省市县有老年人的户数、户口登记地在外的人口情况

    人口数据是我们在各项研究中最常用的数据之一.人口数据的主要来源是我国每十年进行一次的人口普查,最近一次的人口普查是2020年进行的第七次人口普查,简称七普! 我们之前介绍了<2020中国人口普查 ...

  8. 人口普查系统_王佐镇全面开展第七次人口普查数据采集处理系统培训暨摸底动员部署会...

    人口普查,惠及万家.第七次全国人口普查具有时间紧.任务重.环节多.难度大的特点,为了确保第七次全国人口普查工作能够顺利开展,王佐镇人普办开展数据采集处理系统培训,确保各社区村业务骨干能够熟练掌握使用智 ...

  9. 第七次全国人口普查登记今日零时启动 六大释疑都在这

    新京报讯 我国第七次全国人口普查登记今日零时正式启动,持续至12月10日,随后开展普查数据处理.汇总等工作,2021年对外发布主要数据公报.本次普查,普查对象首次可选择自主填报,也可以由普查员上门登记 ...

最新文章

  1. ECCV2020超快车道线检测算法:Ultra Fast Structure-aware Deep Lane Detection
  2. python3.6.0安装教程-Python 3.6.0下载及安装教程
  3. 成功解决TypeError: unsupported operand type(s) for +: 'dict_items' and 'list'
  4. k8s 离线安装_阿里开源 k8s 事件通知服务
  5. TensorFlow(二)
  6. CF1375F-Integer Game【交互】
  7. 【iCore1S 双核心板_FPGA】例程十:乘法器实验——乘法器的使用
  8. platform_device_add()函数分析
  9. 两种分布式锁实现方案(一)
  10. 分步表单_后台产品设计之表单页设计
  11. Visual Studio vs软件下载 vax Visual Assist X VAssistX
  12. ps软件怎么测试性能,怎么用ps测试电脑性能 设计师要知道
  13. 由于磁盘坏道导致的系统卡顿令我抓狂
  14. java阴阳师抽卡算法_阴阳师最强召唤黑科技:如何抽卡必出SSR
  15. GFS —— 分布式文件系统
  16. 这图怎么画| 相关性热图+柱状图
  17. 微信公众平台后台编辑器上线图片缩放和封面图裁剪功能
  18. PS中磁性套索工具实现算法
  19. Python学习基础笔记三十二——正则表达式
  20. c语言程序设计工资纳税系统,C语言程序设计纳税工资系统

热门文章

  1. 【ES6】阮一峰ES6学习之Module的语法
  2. 【ES6】阮一峰ES6学习之Generator 函数(一)
  3. 嵩天python测验4_嵩天Python学习笔记-04
  4. 计算机一级ms office应用题,计算机一级考试MSOffice练习题(含答案)
  5. Latex学术论文期刊模版写作总结
  6. 采用CXF框架发布WebService
  7. 正则表达式判断手机号的运营商(电信移动联通)
  8. 小梅哥——38译码器
  9. 计算机应用计算题(61),计算机应用模拟试题及答案
  10. 开源配置管理工具config-toolkit 使用心得