本文实例讲述了Python爬虫实现全国失信被执行人名单查询功能。分享给大家供大家参考,具体如下:

一、需求说明

利用百度的接口,实现一个全国失信被执行人名单查询功能。输入姓名,查询是否在全国失信被执行人名单中。

二、python实现

版本1:

# -*- coding:utf-8*-

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

import time

import requests

time1=time.time()

import pandas as pd

import json

iname=[]

icard=[]

def person_executed(name):

for i in range(0,30):

try:

url="https://sp0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php?resource_id=6899" \

"&query=%E5%A4%B1%E4%BF%A1%E8%A2%AB%E6%89%A7%E8%A1%8C%E4%BA%BA%E5%90%8D%E5%8D%95" \

"&cardNum=&" \

"iname="+str(name)+ \

"&areaName=" \

"&pn="+str(i*10)+ \

"&rn=10" \

"&ie=utf-8&oe=utf-8&format=json"

html=requests.get(url).content

html_json=json.loads(html)

html_data=html_json['data']

for each in html_data:

k=each['result']

for each in k:

print each['iname'],each['cardNum']

iname.append(each['iname'])

icard.append(each['cardNum'])

except:

pass

if __name__ == '__main__':

name="郭**"

person_executed(name)

print len(iname)

#####################将数据组织成数据框###########################

data=pd.DataFrame({"name":iname,"IDCard":icard})

#################数据框去重####################################

data1=data.drop_duplicates()

print data1

print len(data1)

#########################写出数据到excel#########################################

pd.DataFrame.to_excel(data1,"F:\\iname_icard_query.xlsx",header=True,encoding='gbk',index=False)

time2=time.time()

print u'ok,爬虫结束!'

print u'总共耗时:'+str(time2-time1)+'s'

三、效果展示

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/全国失信被执行人查询.py

郭** 34122319790****5119

郭** 32032119881****2419

郭** 32032119881****2419

3

IDCard name

0  34122319790****5119  郭**

1  32032119881****2419  郭**

2

ok,爬虫结束!

总共耗时:7.72000002861s

Process finished with exit code 0

版本2:

# -*- coding:utf-8*-

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

import time

import requests

time1=time.time()

import pandas as pd

import json

iname=[]

icard=[]

courtName=[]

areaName=[]

caseCode=[]

duty=[]

performance=[]

disruptTypeName=[]

publishDate=[]

def person_executed(name):

for i in range(0,30):

try:

url="https://sp0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php?resource_id=6899" \

"&query=%E5%A4%B1%E4%BF%A1%E8%A2%AB%E6%89%A7%E8%A1%8C%E4%BA%BA%E5%90%8D%E5%8D%95" \

"&cardNum=&" \

"iname="+str(name)+ \

"&areaName=" \

"&pn="+str(i*10)+ \

"&rn=10" \

"&ie=utf-8&oe=utf-8&format=json"

html=requests.get(url).content

html_json=json.loads(html)

html_data=html_json['data']

for each in html_data:

k=each['result']

for each in k:

print each['iname'],each['cardNum'],each['courtName'],each['areaName'],each['caseCode'],each['duty'],each['performance'],each['disruptTypeName'],each['publishDate']

iname.append(each['iname'])

icard.append(each['cardNum'])

courtName.append(each['courtName'])

areaName.append(each['areaName'])

caseCode.append(each['caseCode'])

duty.append(each['duty'])

performance.append(each['performance'])

disruptTypeName.append(each['disruptTypeName'])

publishDate.append(each['publishDate'])

except:

pass

if __name__ == '__main__':

name="郭**"

person_executed(name)

print len(iname)

#####################将数据组织成数据框###########################

# data=pd.DataFrame({"name":iname,"IDCard":icard})

detail_data=pd.DataFrame({"name":iname,"IDCard":icard,"courtName":courtName,"areaName":areaName,"caseCode":caseCode,"duty":duty,"performance":performance,\

"disruptTypeName":disruptTypeName,"publishDate":publishDate})

#################数据框去重####################################

# data1=data.drop_duplicates()

# print data1

# print len(data1)

detail_data1=detail_data.drop_duplicates()

# print detail_data1

# print len(detail_data1)

#########################写出数据到excel#########################################

pd.DataFrame.to_excel(detail_data1,"F:\\iname_icard_query.xlsx",header=True,encoding='gbk',index=False)

time2=time.time()

print u'ok,爬虫结束!'

print u'总共耗时:'+str(time2-time1)+'s'

希望本文所述对大家Python程序设计有所帮助。

python怎么爬虫人信息_Python爬虫实现全国失信被执行人名单查询功能示例相关推荐

  1. python找人_Python爬虫实现全国失信被执行人名单查询功能示例

    本文实例讲述了Python爬虫实现全国失信被执行人名单查询功能.分享给大家供大家参考,具体如下: 一.需求说明 利用百度的接口,实现一个全国失信被执行人名单查询功能.输入姓名,查询是否在全国失信被执行 ...

  2. python名单查询_Python爬虫实现全国失信被执行人名单查询功能示例

    本文实例讲述了python爬虫实现全国失信被执行人名单查询功能.分享给大家供大家参考,具体如下: 一.需求说明 利用百度的接口,实现一个全国失信被执行人名单查询功能.输入姓名,查询是否在全国失信被执行 ...

  3. 【python 爬虫】全国失信被执行人名单查询功能

    一.需求说明 利用百度的接口,实现一个全国失信被执行人名单查询功能.输入姓名,查询是否在全国失信被执行人名单中. 二.python实现 版本1: # -*- coding:utf-8*- import ...

  4. 【python 爬虫】全国失信被执行人名单爬虫

    一.需求说明 通过百度的接口,爬取全国失信被执行人名单.翻页爬虫,获取姓名,身份证等信息. 二.python实现 版本1: # -*- coding:utf-8*- import sys reload ...

  5. 全国失信被执行人名单爬虫

    一.需求说明  通过百度的接口,爬取全国失信被执行人名单.翻页爬虫,获取姓名,身份证等信息. 二.python实现 版本1: # -*- coding:utf-8*- import sys reloa ...

  6. python爬虫电影信息_Python爬虫入门 | 爬取豆瓣电影信息

    这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬 ...

  7. python爬取控制台信息_python爬虫实战之爬取智联职位信息和博客文章信息

    1.python爬取招聘信息 简单爬取智联招聘职位信息 # !/usr/bin/env python # -*-coding:utf-8-*- """ @Author  ...

  8. python爬虫应聘信息_python爬虫获取拉钩网在线搜索招聘信息(超实用!)

    # -*- encoding: utf-8 -*- """ """ #  导入相应的包 import requests import tim ...

  9. 北京python爬虫招聘信息_Python爬虫:抓取智联招聘岗位信息和要求(基础版)

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:王强 ( 想要学习Python?Python学习交流群 ...

最新文章

  1. Discuz NT 架构剖析之Config机制
  2. mysql 绕过空格_SQL注入篇-绕过方法
  3. python用途与前景-2019年Python就业及发展前景如何 看完你就清晰了
  4. SH 脚本注意事项之 IF 判断
  5. Python3经典100道练习题003
  6. linux系统不知道电脑密码怎么办,Linux如何修复系统的Root密码 -电脑资料
  7. 安装OpenCL和AMD驱动程序
  8. 高等数学同济第七版上册电子版_高等数学同济第七版(上册)第一章答案
  9. 编译php时提示“Cannot find MySQL header files”的解决方法
  10. 奇葩属性:layout_weight 的解释及使用
  11. 入驻商家卖违禁药物、评论造假、试水会员,直播能让新氧再次“乘风破浪”吗?
  12. EasyExcel 读.CSV 文件数据为null或乱码问题
  13. 如何使用手机将PDF合并呢?分享一个手机合并文件方法
  14. curl命令发送Post请求
  15. IntelliJ IDEA主题背景设置护眼色
  16. 实战PyQt5: 141-QChart图表之箱形图
  17. Mysql中的redo log
  18. 2.Python环境搭建
  19. 12V-240V蓄电池放电容量测试仪(放电仪)功能介绍及技术参数
  20. 关于虚拟机镜像无法检测

热门文章

  1. nginx根据域名二级目录进行转发实现负载均衡
  2. Planar Homographies (平面单应矩阵)
  3. Linux服务器添加永久明细路由
  4. IsMouseOver 和MouseEnter\MouseLeave 事件
  5. uniapp支付宝小程序授权用户信息、授权手机号码
  6. JavaWeb尚硅谷【学习笔记】(整合)未完成
  7. 默认取消 uni 返回键
  8. 共享单车在电子科大使用情况调研
  9. Unity文件夹增强插件Rainbow Folders
  10. java毕设项目慧学IT精品课程网站(附源码)