python爬取统计局数据_利用Python抓取行政区划码的方法
前言
国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。
注意:抓取下来以后还要进行简单的人工的整理
示例代码:
# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
def get_xzqh():
html_data = requests.get(base_url).content
pattern = re.compile('
(\d+).*?(.*?)
')
areas = re.findall(pattern,html_data)
print "code,name,level"
for area in areas:
print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
if __name__=='__main__':
get_xzqh()
注意事项:
另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052
如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。
code都是按照ISO3166标准写的,极易导入数据库。
总结
以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。
python爬取统计局数据_利用Python抓取行政区划码的方法相关推荐
- python爬去百度文库_利用Python语言轻松爬取数据[精品文档]
利用 Python 语言轻松爬取数据 对于小白来说,爬虫可能是一件非常复杂. 技术门槛很高的事情. 比如有人认为学爬虫必须精通 Python ,然后哼哧哼哧系统学习 Python 的每个知识点,很久之 ...
- java爬取网页数据_利用Python做数据分析—对前程无忧数据类岗位进行分析
引言 随着时代的发展,我国在各行各业都需要大量的人才引进,处于近几年最热门的行业也称"最火行业":大数据.数据分析.数据挖掘.机器学习.人工智能,这五门行业各有不同又互有穿插.近几 ...
- python爬去朋友圈_利用Python爬取朋友圈数据,爬到你开始怀疑人生
人生最难的事是自我认知,用Python爬取朋友圈数据,让我们重新审视自己,审视我们周围的圈子. 文:朱元禄(@数据分析-jacky) 哲学的两大问题:1.我是谁?2.我们从哪里来? 本文 jacky试 ...
- python爬取软件数据_利用Python爬取爬取APP上面的数据
前言 在我们在爬取手机APP上面的数据的时候,都会借助Fidder来爬取.今天就教大家如何爬取手机APP上面的数据. 环境配置 1.Fidder的安装和配置 下载Fidder软件地址:https:// ...
- python爬去朋友圈_利用Python爬取朋友圈数据
确定数据源 自我认知,很难,必须它证. 物以类聚,人以群分.每个人的社交圈,家庭圈,朋友圈的属性,基本我们人格的特征属性.我们所处的阶级,在别人眼中的印象,在我们的朋友圈中都会得到印证. 朋友圈数据中 ...
- python爬取高德数据_利用Python爬取高德地图数据
准备1.高德开放平台注册账户 https://lbs.amap.com/dev/index 验证手机号码.邮箱后进入开发者后台创建一个应用: 并为该应用添加 Key,服务平台选择 web 服务 申请完 ...
- python爬朋友圈数据_利用Python爬取朋友圈数据,爬到你开始怀疑人生
人生最难的事是自我认知,用Python爬取朋友圈数据,让我们重新审视自己,审视我们周围的圈子. 文:朱元禄(@数据分析-jacky) 哲学的两大问题:1.我是谁?2.我们从哪里来? 本文 jacky试 ...
- 利用python从网页查找数据_利用Python模拟淘宝的搜索过程并对数据进行可视化分析...
数据挖掘入门与实战 公众号: datadw 本文讲述如何利用Python模拟淘宝的搜索过程并对搜索结果进行初步的数据可视化分析. 搜索过程的模拟:淘宝的搜索页面有两种形式, 一种形式是, 2019/2 ...
- python根据url下载数据_利用Python如何实现根据URL地址下载并保存文件至对应目录...
利用Python如何实现根据URL地址下载并保存文件至对应目录 发布时间:2020-11-16 14:23:11 来源:亿速云 阅读:58 作者:Leah 这篇文章将为大家详细讲解有关利用Python ...
- python处理水站的数据_利用Python进行数据分析(一):数据清洗与准备
b站的小伙伴们大家吼~~ 在b站摸了快四年鱼的菜鸡也想开始做知识分享了,虽然说是分享其实根本目的也是为了督促自己好好学习把QAQ. 从今天开始,我将会在专栏分享我在学习<利用Python进行数据 ...
最新文章
- 蚂蚁某程序员吐槽前端招人难:一是因为要求高,二是因为招聘卷!网友却说:十万月薪也不去阿里!...
- sqlserver存储过程的参数传递注意事项
- JavaScript中的回调地狱及解决方法
- 丹东御空服务器维修,【正式服】3月14日例行更新维护公告
- jenkins没安装git报错
- 71道经典Android面试题,涵盖了所有android知识点,值得学习和思考
- 【学生党福利】AD 学生免费许可申请
- python获取日期_python 获取日期
- 超大图像的二值化方法
- 自动驾驶 4-4 纵向车辆建模Longitudinal Vehicle Modeling
- android studio 中 Cannot resolve symbol 'R'(XXX) 如何解决
- Dubbo 源码解析 —— Directory
- 安卓对讲机安装滔滔对讲黑屏起麦黑屏对讲设置
- 大脑的扩散磁共振成像(Diffusion MRI)—理论和概念
- 计算机语言s是什么,什么是语义学(Semantics)?
- LeetCode 打家劫舍题型 解析
- 选择退化特征时,利用单调性、鲁棒性、预测性三指标选择(附matlab代码)
- 汤姆熊游艺厅抓娃娃技巧汇总
- Tableau画条形图、直方图、折线图、饼图、环形图、箱线图
- 域名访问Winmail邮件服务器