一、北京积分落户政策概述

北京积分落户制是北京市政协建议推行的积分落户政策,以科技贡献、专业技能、在京时间等指标为考核项,计算非京籍人才的“积分”,积分达标即可落户北京。北京市积分落户自2017年1月1日起施行,每年申请一次。

二、北京积分落户的部分积分指标

北京积分落户一共有9项积分指标,下面罗列了其中的4项,这4项也是积分分值较多、较容易拉开差距且获得高分的指标。

为了能更直观地反映2018年北京积分落户的情况,下面将对2018年落户成功的人员名单就行分析。

三、导入要使用的模块

import pandas as pd
from matplotlib import pyplot as plt
from matplotlib import rcParams

四、读取数据

luohu_data = pd.read_csv("./beijing_luohu.csv", index_col = "id")
luohu_data.index.name = None
rcParams["font.sans-serif"] = ["KaiTi"]
rcParams['axes.unicode_minus'] = False

查看分值的基本情况:

print("最低分:",luohu_data["score"].min())
print("最高分:",luohu_data["score"].max())
print("平均分:",round(luohu_data["score"].mean(),2))

输出:
最低分: 90.75
最高分: 122.59
平均分: 95.65

五、清洗数据

由于北京积分落户名单是官方发布的,数据较规范,不过为了确保无误,我们可以执行以下代码:

print(luohu_data.info())

输出:
<class ‘pandas.core.frame.DataFrame’>
Int64Index: 6019 entries, 1 to 6019
Data columns (total 4 columns):
name 6019 non-null object
birthday 6019 non-null object
company 6019 non-null object
score 6019 non-null float64
dtypes: float64(1), object(3)
memory usage: 235.1+ KB

显然,这份名单有6019条数据,且各个字段都没有缺失值,因此我们可以直接分析。

六、分析及可视化

1. 落户成功人数最多的前20名公司

# 对公司进行分组
company_gb = luohu_data.groupby(by = "company", as_index = False).count()[["company", "name"]]
company_gb = company_gb.rename(columns = {"name" : "people_num"})
company_gb_sort_data = company_gb.sort_values("people_num")
company_name = company_gb_sort_data.tail(20)["company"]
company_people_count = company_gb_sort_data.tail(20)["people_num"]
# 绘图
plt.figure(figsize = (15,10), dpi = 80)
plt.xticks(size =18)
plt.yticks(size = 15)
# 设置不同柱子不同颜色
color = ["orange"] * 19 + ["red"]
rects = plt.barh(company_name, company_people_count, height = 0.5, color = color)
for rect in rects:rect_width = rect.get_width()    # 获取每组条形图的长度plt.text(rect_width+1, rect.get_y()+0.1, str(rect_width),  size = 18)
plt.title("2018年北京积分落户公司人数排行榜前20名", size = 25)
plt.xlabel("人数", size = 20)
plt.grid(ls = "--", alpha = 0.4)
plt.show()


不难发现,华为是2018年北京积分落户中的突出企业,其中北京华为数字技术有限公司的落户人数最多,为137人;华为技术有限公司北京研究所有27人,位居第10,可谓力压群雄。其次,落户人员所在行业广泛,如金融、制造、科技、通信等,其中IT企业、国企较为集中。

2. 不同分数段的人数分布

# 对分数进行分桶
bins = [i for i in range(90,126,5)]
score_cut = pd.cut(luohu_data["score"], bins = bins)   # 统计不同区间的人数
score_counts = score_cut.value_counts()
score_counts_values = score_counts.values# 将条形图画成直方图
plt.figure(figsize = (10,8), dpi = 80)
_x = [i - 0.5 for i in range(len(bins)+1)]
_xticks_label = bins
_xticks_label.insert(0,0)
plt.xticks(_x, _xticks_label, size = 15)
plt.yticks(size = 15)
rects = plt.bar(range(1,8), score_counts_values, width = 1, edgecolor = "c")
for rect in rects:rect_height = rect.get_height()plt.text(rect.get_x()+0.3, rect_height+30, str(rect_height), size = 18)
plt.title("2018年北京积分落户人员积分分布直方图", size = 22)
plt.xlabel("积分", size = 20)
plt.ylabel("人数", size = 20)
plt.grid(ls = "--", alpha = 0.4)
plt.show()


从直方图可以看出,落户人员的积分主要集中在90~100分,其中95分及以下的人数占总人数的55.6%。而积分在110以上的只有47人,造成高分段人数较少的原因有:

  1. 高学历(硕士及以上)的人才较少
  2. 达到创新创业指标的人员较少
  3. 获得荣誉表彰(如全国道德模范、 首都见义勇为好市民等)的人员较少

3. 不同年龄段的人数分布

# 将出生年月转化为时间格式
luohu_data["birthday"] = pd.to_datetime(luohu_data["birthday"])
# 计算每个人的年龄
luohu_data["age"] = (pd.to_datetime("2018-10") - luohu_data["birthday"])//pd.Timedelta("365 days")
bins = [32, 34, 36, 38, 40, 42, 45, 48, 50, 60]
age_cut = pd.cut(luohu_data["age"], bins = bins)
age_cut_value_counts = age_cut.value_counts()# 取每个区间的左区间值作为索引
age_cut_value_counts.index = [i.left for i in age_cut_value_counts.index]
age_cut_value_counts = age_cut_value_counts.sort_index()plt.figure(figsize = (10,8), dpi = 80)
plt.yticks(size = 18)
_x = [i-0.5 for i in range(len(age_cut_value_counts.index)+3)]
_xticks_label = list(age_cut_value_counts.index)   # 转化为列表方便插入数据
_xticks_label.insert(0,0)
_xticks_label.insert(11,60)
plt.xticks(_x, _xticks_label, size = 18)
rects = plt.bar(range(1,10), age_cut_value_counts.values, width = 1, color = "#6495ED", edgecolor = "#CFCFCF")
for rect in rects:height = rect.get_height()plt.text(rect.get_x()+0.3, height+20, str(height), size = 18)
plt.xlabel("年龄段", size = 18)
plt.ylabel("总人数", size = 18)
plt.title("2018年北京积分落户不同年龄段人数分布直方图", size = 20)
plt.grid(ls = "--", alpha = 0.4)
plt.show()



落户人员中,48岁及以下(1970年以后出生)的人员有5990人,占比约99.5%,处于绝对主体地位;其次,落户人员集中在38~45岁,其中42~45岁年龄段的人数最多,为1765人,这个年龄段的人既能满足年龄指标,工作也相对稳定,工作年限较长,体现了长期在京工作的要求。

七、总结

根据北京积分落户的积分指标以及对2018年结果的分析,为了能以高积分的优势顺利落户北京,满足以下条件是关键:

  1. 年龄不宜超过45周岁:积分指标中明确指出,超出45周岁将失去20分的积分机会。
  2. 达到创新创业指标:获得国家级奖项可得较多积分。
  3. 获得荣誉表彰:获得荣誉表彰亦可获得较多积分。

案例:2018年北京积分落户分析相关推荐

  1. 利用python分析:2018年北京积分落户数据

    ''' 本次分析的数据是2018年北京积分落户数据分析 这个数据是从官网上下载下来的,因此此数据不存在数据缺失,不需要做数据清洗 本文是使用numpy.pandas和matplotlib来分析此数据 ...

  2. 图表分析2020年和2018年北京积分落户数据

    一年一度的积分落户工作马上要开始了,刚好对于2020年的分数情况还做了一些统计,总体的感觉就是:水涨船高. 2020年10月15日,2019年北京积分落户人员名单出炉:最低分值93.58分,6007人 ...

  3. 普通人如何通过积分落户北京? 2021北京积分落户分析必看

    北京积分落户制是北京市政协建议推行积分落户政策,以科技贡献.专业技能.在京时间等指标为考核项,计算非京籍人才的"积分",积分达标即可落户北京.也给了我们一众北漂希望,毕竟随着时间的 ...

  4. 2018年北京积分落户数据分析 看这篇就够了

    2018北京积分落户名单 百度网盘提取码: w7gy 话不多说,直接上代码 import numpy as np import pandas as pd import matplotlib.pyplo ...

  5. 2018年北京积分落户数据分析

    1.数据: 链接:https://pan.baidu.com/s/1xl2h1I8O8E2xvzytEuPmFQ  提取码:fcrn 2.从不同的维度分析数据: 公司维度.年龄维度.不同分数段 3.以 ...

  6. 北京积分落户2018年与2019年分析

    本月度的第一天也就是6月1号,北京交通委发布了<北京市小客车数量调控暂行规定(修订草案征求意见稿)>.<〈北京市小客车数量调控暂行规定〉实施细则(修订征求意见稿)>.<关 ...

  7. 北京积分落户要积多少分才可以

    如果是2021年想上岸的话,总积分应该在100左右. 可以推算下: 硕士学历26+年龄小于45加20+社保15年45分+8年租房4分+7年买房7分=102.硕士学历,15年社保,租房8年,买房7年,勉 ...

  8. datatables每页显示数据刷新后不变_2019北京积分落户名单数据的一些分析

    2020,新一波北京积分落户又开始了. 在此,奉上去年闲来无事分析的19年北京积分落户的一些公开数据,把握一下猴年马月才能中标的趋势. 前半部分主要是技术环节,心急的可以直接跳到后半部分看具体的数据分 ...

  9. python分析政策实施前后_使用Python分析北京积分落户数据,分析完我陷入了深思...

    北京积分落户制是北京市政协建议推行积分落户政策,以科技贡献.专业技能.在京时间等指标为考核项,计算非京籍人才的"积分",积分达标即可落户北京.也给了我们一众北漂希望,毕竟随着时间的 ...

最新文章

  1. 史上最全排序算法总结!建议收藏
  2. 开源wkhtmltopdf使用心得 (四)
  3. SP1043 GSS1 - Can you answer these queries I(线段树,区间最大子段和(静态))
  4. progress与meter的区别
  5. JAVA_OA(八):springMVC对JDBC的操作小项目b
  6. Kafka消费者详解
  7. 史上最简洁易懂的PGP邮件加密教程(MAC OS X版)
  8. [设计模式]6. C++与职责链模式(chain of rsponsibility pattern)
  9. MS SQL查询库、表、列数据结构信息汇总
  10. watchOS更新后 Apple Watch 4心电图功能已开始支持欧洲用户
  11. 异常之【You have an error in your SQL syntax】
  12. 区间内素数的个数(也要用到埃氏算法)
  13. 《构建之法》阅读笔记05
  14. Java语言实现冒泡排序
  15. 【node进阶】深入浅出websocket即时通讯(二)-实现简易的群聊私聊
  16. 阿里ET大脑如何帮助养猪产业提升PSY从20到32?
  17. Android 一个简单手机响铃功能实现
  18. 民间秘术——可怕的死亡诅咒
  19. H5页面微信授权登录——前端部分
  20. .NET Micro Framework简介

热门文章

  1. 树莓派4B-Python-四种人脸检测/人脸识别
  2. 马云:一篇百看不厌的文章
  3. Vue学习第14天——vue自定义事件及详细代码演示
  4. 【SQL】SQL Case When用法
  5. input输入框回车事件响应
  6. 6.S081——Lab2——system calls
  7. Python input 函数
  8. Linux下使用“avconv“捕捉录制桌面视频及音频
  9. 关于FTP主动模式与被动模式的一点理解
  10. 关于Java加载类顺序的问题