python requests 爬取数据
import requests
from lxml import etree
import time
import pymysql
import json
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36','Content-Type':'application/x-www-form-urlencoded','Pragma':'no-cache','Upgrade-Insecure-Requests':'1','Content-Length':'86','Host':'www.bjda.gov.cn'
}headers_xiangqing={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36','Pragma':'no-cache','Upgrade-Insecure-Requests':'1','Host':'www.bjda.gov.cn'
}dd={'pageSize':'20'
}temp=[]dd['currentPage'] = '10'
print(dd)
response = requests.post('http://www.bjda.gov.cn/eportal/ui?pageId=348736', headers=headers, data=dd)
selector = etree.HTML(response.text)
item_spider = list(set(selector.xpath('//tr[@class="chaxun_con"]//a/@href')))
temp.extend(item_spider)for i in temp:print('http://www.bjda.gov.cn/eportal/ui?pageId=348738&'+i[1:])response=requests.get('http://www.bjda.gov.cn/eportal/ui?pageId=348738&'+i[1:],headers=headers_xiangqing)print(response.status_code)selector=etree.HTML(response.text)tr=selector.xpath('//table[@class="table_sjcx"]//tr')print(tr

posted on 2018-04-18 11:15 秦瑞It行程实录 阅读(...) 评论(...) 编辑 收藏

转载于:https://www.cnblogs.com/ruiy/p/8872962.html

python requests 爬取数据相关推荐

  1. 如何用六步教会你使用python爬虫爬取数据

    前言: 用python的爬虫爬取数据真的很简单,只要掌握这六步就好,也不复杂.以前还以为爬虫很难,结果一上手,从初学到把东西爬下来,一个小时都不到就解决了. python爬出六部曲 第一步:安装req ...

  2. Python爬虫---爬取数据(上)

    又是女票,拿了3万多条的13年某地区的公司信息,但是三年过去了,工商局的注册信息发生了巨大变化,有的注册资本增加了,有的公司老板变多了,更有不少公司不存在了,因此,需要一份最新的信息以便于她进行使用. ...

  3. python在线爬取数据导入Neo4j创建知识图谱

    近期学习Neo4j,以豆瓣top250数据为研究对象,实现python在线爬取数据写入Neo4j创建知识图谱,下文详细介绍步骤. 1.知识图谱设计 通过分析网页,爬取网页可以得到movie.count ...

  4. Python 学习 02 —— Python如何爬取数据

    文章目录 系列文章 二.Python 爬 虫 1.任务介绍 2.简介 3.基本流程 3.1.准备工作 3.1.1.分析页面 3.1.2.编码规范 3.1.3.导入模块 3.1.4.程序流程 3.2.获 ...

  5. python+requests+ 爬取官网双色球开奖数据

    python+requests+mysql 爬取官网双色球开奖数据 分析网页数据获取方式 第一种查询方式 第二种查询方式 完整代码 分析网页数据获取方式 第一种查询方式 在官网上 可以找到多种数据查询 ...

  6. python爬取百度搜索_使用Python + requests爬取百度搜索页面

    想学一下怎样用python爬取百度搜索页面,因为是第一次接触爬虫,遇到一些问题,把解决过程与大家分享一下 1.使用requests爬取网页 首先爬取百度主页www.baidu.com import r ...

  7. python为啥爬取数据会有重复_利用Python来爬取“吃鸡”数据,为什么别人能吃鸡?...

    原标题:利用Python来爬取"吃鸡"数据,为什么别人能吃鸡? 首先,神装镇楼 背景 最近老板爱上了吃鸡(手游:全军出击),经常拉着我们开黑,只能放弃午休的时间,陪老板在沙漠里奔波 ...

  8. python初学者爬取数据完整教程

    都说python爬网页数据方便,我们今天就来试试,python爬取数据到底有多方便 简介 爬取数据,基本都是通过网页的URL得到这个网页的源代码,根据源代码筛选出需要的信息 准备 IDE:pyChar ...

  9. Python爬虫爬取数据

    我是Python小白,我会用比较通俗易懂的方法告诉你如何去爬取数据. 一开始,我们需要pycharm(也就是我们编代码的工具),其次我们需要打开我们需要爬取数据的网页,我以鞋子为例. 那么,接下来就开 ...

最新文章

  1. php登录失败后,php – X尝试失败后阻止登录
  2. echarts ucharts 和_使用chart和echarts制作图表
  3. SAP EWM 性能优化(一)
  4. RubyGems 镜像
  5. 图标化java_java最小化到托盘显示图标实现
  6. web静态资源访问规则||webjars的访问配置——webjars是maven库里面对css js image打的一个jar包
  7. sklearn-GridSearchCV调节超参数
  8. /etc/bashrc和/etc/profile傻傻分不清楚?
  9. 开发缺点_开发移动端手机APP有哪些优缺点?
  10. 使用hive完成统计分析功能
  11. 数据:Purpose以太坊ETF的持仓量达到4万枚ETH
  12. linux服务器 缓存,Linux服务器内存使用分析及内存缓存
  13. 使用Python和Numpy进行波士顿房价预测任务(二)【深度学习入门_学习笔记】
  14. 某企业通达OA任意登录漏洞复现
  15. VUE解决背景图片没有铺满的问题
  16. DOS专题之基本命令
  17. 数据查询网站汇总——自用
  18. c语言printf输出整数数字,C语言 念数字 输入一个整数,输出每个数字对应的拼音。当整数为负数时,先输出fu字...
  19. SOA 的定义 ——谢炯
  20. mysql主备集群(高可用)

热门文章

  1. iOS App上架流程(2016详细版)
  2. 等宽矩阵(a)相乘a %*% x = b的逆运算solve(a,b)=x
  3. Nginx 作为web server 的优化要点
  4. C# 5.0中引入了async 和 await
  5. Android如何更新app的版本(中级)
  6. 关于一个js传值的错误
  7. Ajax 中XmlHttp 乱码 的解决方法 (UTF8,GB2312 编码 解码)
  8. Linux下Tomcat重新启动
  9. python_cookies
  10. [转]MySQL innodb buffer pool