继上一篇文章《python实现【国家统计局】三级区划代码和城乡划分代码爬取》我们爬取了国家统计局中公布出来的行政区划编码数据,今天我们发现了民政局也公布了类似的数据,但是这个不需要爬取,可以直接下载网站提供的压缩包就好了,压缩包解压缩后我们得到的是 .sqlite 形式的数据库文件,想要查看数据内容就需要对该类型的数据库文件进行解析处理。

具体的数据读取实现如下:

#!usr/bin/env python
# encoding:utf-8
from __future__ import division"""
__Author__:沂水寒城
功能:  python解析处理 .sqlite文件
"""import sqlite3
import pandas as pdwith sqlite3.connect('data.sqlite') as con:df1=pd.read_sql_query("SELECT * FROM info_yuan", con=con)df2=pd.read_sql("SELECT * FROM info_yuan", con=con)print df1.shapeprint df1.dtypesprint df1.head()print '='*30print df2.shapeprint df2.dtypesprint df2.head()

上述实现主要是借助于sqlite3和pandas完成了数据库文件内容的解析处理。

其中,read_sql_query和read_sql均可以完成数据的查询操作,输出结果如下:


(3219, 31)
xingZhengId          object
xingZhengCode        object
shengJi              object
diJi                 object
xianJi               object
zhuDi                object
xingZhengJiBie       object
leiXing              object
renKou               object
mianJi               object
quHuaDaiMa           object
quHao                object
youBian              object
xiaXiaQingKuang      object
shiXiaQu             object
xianJiShi            object
xian                 object
ziZhiXian            object
qi                   object
ziZhiQi              object
teQu                 object
zuiZhongZhuangTai    object
shengHuiMingCheng    object
shiXiaQuRenkou       object
shiXiaQuMianji       object
xianJiShiRenkou      object
xianJiShiMianji      object
pinYin               object
jianPin              object
isShouFu             object
quanPin              object
dtype: objectxingZhengId     xingZhengCode     ...      isShouFu      quanPin
0      119215  1387767589510000     ...             1   BeijingShi
1      122796  1387767589540000     ...             0  DongchengQu
2      119218  1387767589550000     ...             0    XichengQu
3      119219  1387767589570000     ...             0   ChaoyangQu
4      119220  1387767589590000     ...             0    FengtaiQu[5 rows x 31 columns]
==============================
(3219, 31)
xingZhengId          object
xingZhengCode        object
shengJi              object
diJi                 object
xianJi               object
zhuDi                object
xingZhengJiBie       object
leiXing              object
renKou               object
mianJi               object
quHuaDaiMa           object
quHao                object
youBian              object
xiaXiaQingKuang      object
shiXiaQu             object
xianJiShi            object
xian                 object
ziZhiXian            object
qi                   object
ziZhiQi              object
teQu                 object
zuiZhongZhuangTai    object
shengHuiMingCheng    object
shiXiaQuRenkou       object
shiXiaQuMianji       object
xianJiShiRenkou      object
xianJiShiMianji      object
pinYin               object
jianPin              object
isShouFu             object
quanPin              object
dtype: objectxingZhengId     xingZhengCode     ...      isShouFu      quanPin
0      119215  1387767589510000     ...             1   BeijingShi
1      122796  1387767589540000     ...             0  DongchengQu
2      119218  1387767589550000     ...             0    XichengQu
3      119219  1387767589570000     ...             0   ChaoyangQu
4      119220  1387767589590000     ...             0    FengtaiQu[5 rows x 31 columns]
[Finished in 1.2s]

原始数据截图如下:

我们查看其前三行数据内容如下:

119215   1387767589510000    北京市(京)          东城区 省级  直辖市 1300    16412   110000          市辖区16   16  0   0   0   0   0   0   4   (中华人民共和国首都) 1300    16412   0   0   BeijingShi  bjs 1   BeijingShi
122796  1387767589540000    北京市(京)  北京市 东城区 景山街道    县级  市辖区 97  42  110101  010 100010                                  1                       DongchengQu dcq 0   DongchengQu
119218  1387767589550000    北京市(京)  北京市 西城区 金融街街道   县级  市辖区 139 51  110102  010 100032                                  1                       XichengQu   xcq 0   XichengQu
119219  1387767589570000    北京市(京)  北京市 朝阳区 朝外街道    县级  市辖区 198 455 110105  010 100020                                  1                       ChaoyangQu  cyq 0   ChaoyangQu

每一条数据记录一共有31个属性字段。

python读取 .sqlite 数据库文件相关推荐

  1. python读取数据库文件的扩展名_Python读取sqlite数据库文件的方法分析

    本文实例讲述了Python读取sqlite数据库文件的方法.分享给大家供大家参考,具体如下: 这是Python内置的,不需要pip install 包 数据库里面有很多张表 要操作数据库首先要连接co ...

  2. python 读取sqlite存入文件_如何通过python读取sqlite数据文件

    sqlite简介:sqlite是一个进程内的库,实现了自给自足的.无服务器的.零配置的.事务性的 SQL 数据库引擎.它的设计目标是嵌入式的,而且目前已经在很多嵌入式产品中使用了它(如安卓系统),它占 ...

  3. python连接sqlite数据库的代码_【Python 连接SQLite数据库文件】

    涉及: Python连接db文件 如何按照列名获取数据 如何传入参数 示例代码如下: # encoding=utf-8 import sqlite3 def get_signal_names(db_f ...

  4. Python读取SQLite数据库数据写入csv

    import sqlite3 import bd_gc_84 import csv import timestart =time.clock() print("正在运行........... ...

  5. python数据库操作sqlite_使用Python对SQLite数据库操作

    原博文 2017-04-05 15:25 − SQLite是一种嵌入式数据库,它的数据库就是一个文件.由于SQLite本身是C写的,而且体积很小,所以,经常被集成到各种应用程序中,甚至在IOS和And ...

  6. python能做数据库开发吗_5分钟快速入门,用Python做SQLite数据库开发,附代码适合初学...

    1. 它是内置的,不需要安装,节省很多麻烦.2. 使用方便,不需要复杂的连接配置,打开本地文件一样简单.3.方便转移.数据库是一个文件.复制.传输和删除可以很容易地处理.4所示.轻量级的性能比大多数其 ...

  7. 如何下服务器上文件是否存在问题,怎么读取服务器数据库文件是否存在

    怎么读取服务器数据库文件是否存在 内容精选 换一换 云服务器新增磁盘,开机自动执行磁盘初始化脚本后,Oralce.MySQL和SQL Server等数据库系统日志Msg 823错误 .磁盘初始化脚本W ...

  8. python操作sqlite数据库_Python操作Sqlite正确实现方法解析

    Python编程语言的优点非常多,它的编程特色主要体现在可扩充性方面.那么,在接下来的这篇文章中,我们将会为大家详细介绍一下有关Python操作Sqlite 的相关应用技巧,希望可以给大家带来些帮助. ...

  9. python数据存储系列教程——python操作sqlite数据库:连接、增删查改、指令执行

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python操作sqlite数据库 sqlite数据库以.db格式的文件形式存在,所以不需要安装驱动和应用系统,在标准库中也集成了sqlite ...

最新文章

  1. 机器学习与高维信息检索 - Note 7 - 核主成分分析(Kernel Principal Component Analysis,K-PCA)
  2. 【c语言】输入输出格式练习
  3. Matlab将多项式的系数设为0
  4. 分享Kali Linux 2017年第12周镜像文件
  5. ViP解读:视觉MLP结构新作
  6. Debug Assertion Failed _CrtlsValidHeapPointer(block) realloc堆引发的错误
  7. 千万不要这样写代码!9种常见的OOM场景演示
  8. 助教总结-【北京电子科技学院_2016-2017-2_程序设计与数据结构】
  9. Dapper的语法应用
  10. 华为Mate 30 Pro再爆猛料:更“大”更高级了
  11. 让你瘦不停的23个小细节 - 生活至上,美容至尚!
  12. 从入门到入土:Python实现爬取某站视频|根据视频编号|支持通过视频名称和创作者名称寻找编号|以及python moviepy合并音频视频
  13. PHP新的连接MySQL方法mysqli
  14. jQuery最核心的基础设施之一——数据缓存模块进化史
  15. Kernel(核函数)
  16. vue.js实现自定义输入分页
  17. P2P下载器-P2P种子搜索器
  18. 收集下载电影的好网站
  19. linux服务器挂掉之后
  20. 燃烧的远征恢复英文语音的方法

热门文章

  1. iTunes连不上iphone
  2. Python-基于ARIMA模型股票趋势预测
  3. 烟草制品业怎么加强固定资产管理软件系统
  4. 消防工程师 1.3 室内消火栓系统
  5. linux 系统rc.d启动脚本剖析
  6. java.sql.SQLException: Unsupported character encoding 'utf8mb4'.
  7. Staking新玩法:锁仓的币也能卖
  8. 初学者必看SSM基本项目(详细图解)
  9. Java语言使用注解处理器生成代码——第三部分:生成源代码
  10. 黑马程序员_java自学学习笔记(八)----网络编程