前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-

'''

获取国家统计局上的行政区划码

'''

import requests,re

base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'

def get_xzqh():

html_data = requests.get(base_url).content

pattern = re.compile('

(\d+).*?(.*?)

')

areas = re.findall(pattern,html_data)

print "code,name,level"

for area in areas:

print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')

if __name__=='__main__':

get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

python爬取统计局数据_利用Python抓取行政区划码的方法相关推荐

  1. python爬去百度文库_利用Python语言轻松爬取数据[精品文档]

    利用 Python 语言轻松爬取数据 对于小白来说,爬虫可能是一件非常复杂. 技术门槛很高的事情. 比如有人认为学爬虫必须精通 Python ,然后哼哧哼哧系统学习 Python 的每个知识点,很久之 ...

  2. java爬取网页数据_利用Python做数据分析—对前程无忧数据类岗位进行分析

    引言 随着时代的发展,我国在各行各业都需要大量的人才引进,处于近几年最热门的行业也称"最火行业":大数据.数据分析.数据挖掘.机器学习.人工智能,这五门行业各有不同又互有穿插.近几 ...

  3. python爬去朋友圈_利用Python爬取朋友圈数据,爬到你开始怀疑人生

    人生最难的事是自我认知,用Python爬取朋友圈数据,让我们重新审视自己,审视我们周围的圈子. 文:朱元禄(@数据分析-jacky) 哲学的两大问题:1.我是谁?2.我们从哪里来? 本文 jacky试 ...

  4. python爬取软件数据_利用Python爬取爬取APP上面的数据

    前言 在我们在爬取手机APP上面的数据的时候,都会借助Fidder来爬取.今天就教大家如何爬取手机APP上面的数据. 环境配置 1.Fidder的安装和配置 下载Fidder软件地址:https:// ...

  5. python爬去朋友圈_利用Python爬取朋友圈数据

    确定数据源 自我认知,很难,必须它证. 物以类聚,人以群分.每个人的社交圈,家庭圈,朋友圈的属性,基本我们人格的特征属性.我们所处的阶级,在别人眼中的印象,在我们的朋友圈中都会得到印证. 朋友圈数据中 ...

  6. python爬取高德数据_利用Python爬取高德地图数据

    准备1.高德开放平台注册账户 https://lbs.amap.com/dev/index 验证手机号码.邮箱后进入开发者后台创建一个应用: 并为该应用添加 Key,服务平台选择 web 服务 申请完 ...

  7. python爬朋友圈数据_利用Python爬取朋友圈数据,爬到你开始怀疑人生

    人生最难的事是自我认知,用Python爬取朋友圈数据,让我们重新审视自己,审视我们周围的圈子. 文:朱元禄(@数据分析-jacky) 哲学的两大问题:1.我是谁?2.我们从哪里来? 本文 jacky试 ...

  8. 利用python从网页查找数据_利用Python模拟淘宝的搜索过程并对数据进行可视化分析...

    数据挖掘入门与实战 公众号: datadw 本文讲述如何利用Python模拟淘宝的搜索过程并对搜索结果进行初步的数据可视化分析. 搜索过程的模拟:淘宝的搜索页面有两种形式, 一种形式是, 2019/2 ...

  9. python根据url下载数据_利用Python如何实现根据URL地址下载并保存文件至对应目录...

    利用Python如何实现根据URL地址下载并保存文件至对应目录 发布时间:2020-11-16 14:23:11 来源:亿速云 阅读:58 作者:Leah 这篇文章将为大家详细讲解有关利用Python ...

  10. python处理水站的数据_利用Python进行数据分析(一):数据清洗与准备

    b站的小伙伴们大家吼~~ 在b站摸了快四年鱼的菜鸡也想开始做知识分享了,虽然说是分享其实根本目的也是为了督促自己好好学习把QAQ. 从今天开始,我将会在专栏分享我在学习<利用Python进行数据 ...

最新文章

  1. 蚂蚁某程序员吐槽前端招人难:一是因为要求高,二是因为招聘卷!网友却说:十万月薪也不去阿里!...
  2. sqlserver存储过程的参数传递注意事项
  3. JavaScript中的回调地狱及解决方法
  4. 丹东御空服务器维修,【正式服】3月14日例行更新维护公告
  5. jenkins没安装git报错
  6. 71道经典Android面试题,涵盖了所有android知识点,值得学习和思考
  7. 【学生党福利】AD 学生免费许可申请
  8. python获取日期_python 获取日期
  9. 超大图像的二值化方法
  10. 自动驾驶 4-4 纵向车辆建模Longitudinal Vehicle Modeling
  11. android studio 中 Cannot resolve symbol 'R'(XXX) 如何解决
  12. Dubbo 源码解析 —— Directory
  13. 安卓对讲机安装滔滔对讲黑屏起麦黑屏对讲设置
  14. 大脑的扩散磁共振成像(Diffusion MRI)—理论和概念
  15. 计算机语言s是什么,什么是语义学(Semantics)?
  16. LeetCode 打家劫舍题型 解析
  17. 选择退化特征时,利用单调性、鲁棒性、预测性三指标选择(附matlab代码)
  18. 汤姆熊游艺厅抓娃娃技巧汇总
  19. Tableau画条形图、直方图、折线图、饼图、环形图、箱线图
  20. 域名访问Winmail邮件服务器

热门文章

  1. oracle10非正常删除卸载干净,win10系统下把Oracle卸载干净
  2. oracle去除字段值的所有英文
  3. MAC表、ARP表、IP路由表区别比较
  4. python双向链表以及双向循环链表
  5. Java 基本数据类型存储位置
  6. PMP课程笔记:第8章 项目质量管理
  7. R语言非参数检验(二)
  8. 分享个10.2越狱手贱删除cydia最糟糕情况的恢复方法
  9. 【学习笔记】程序员学操作系统
  10. python chardet模块,没有名为“chardet”的模块