python基础代码库-python爬虫基础教程:requests库(二)代码实例
get请求
简单使用
import requests
'''
想要学习Python?Python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载!
'''
response = requests.get("https://www.baidu.com/")
#text返回的是unicode的字符串,可能会出现乱码情况
# print(response.text)
#content返回的是字节,需要解码
print(response.content.decode('utf-8'))
# print(response.url) #https://www.baidu.com/
# print(response.status_code) #200
# print(response.encoding) #ISO-8859-1
添加headers和params
import requests
params = {
'wd':'python'
}
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
}
response = requests.get("https://www.baidu.com/s",params=params,headers=headers)
#content返回的是字节,需要解码
with open('baidu.html','w',encoding='utf-8') as f:
f.write(response.content.decode('utf-8'))
POST请求
爬去拉钩网职位信息
import requests
url = "https://www.lagou.com/jobs/positionAjax.json?city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false"
data = {
'first':'true',
'pn':1,
'kd':'python'
}
headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36",
"Referer":"https://www.lagou.com/jobs/list_python?city=%E5%8C%97%E4%BA%AC&cl=false&fromSearch=true&labelWords=&suginput="
}
response = requests.post(url,data=data,headers=headers)
# print(response.text)
print(type(response.text)) #
print(type(response.json())) #
print(response.json()) #获取为字典的形式
使用代理
import requests
proxy = {'http':'115.210.31.236.55:9000'}
response = requests.get("https://www.baidu.com/",proxies=proxy)
print(response.content.decode('utf-8'))
session登录
# _*_ coding:utf-8 _*_
import requests
# 1. 创建session对象,可以保存Cookie值
ssion = requests.session()
# 2. 处理 headers
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
# 3. 需要登录的用户名和密码
data = {"email":"158xxxxxxxx", "password":"pythonxxxxxxx"}
# 4. 发送附带用户名和密码的请求,并获取登录后的Cookie值,保存在ssion里
ssion.post("http://www.renren.com/PLogin.do", data = data)
# 5. ssion包含用户登录后的Cookie值,可以直接访问那些登录后才可以访问的页面
response = ssion.get("http://zhibo.renren.com/news/108")
# 6. 打印响应内容
print(response.text)
以上所述是小编给大家介绍的python爬虫基础教程:requests库(二)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
python基础代码库-python爬虫基础教程:requests库(二)代码实例相关推荐
- 爬虫系统基础框架 何时使用爬虫框架? requests库 + bs4来实现简单爬虫
转载请注明出处https://www.cnblogs.com/alexlee666/p/10180519.html,谢谢! 文中图片来自于我的简书博客. 一. 爬虫用途和本质: 网络爬虫顾名思义即模仿 ...
- Python 网络爬虫笔记2 -- Requests库实战
Python 网络爬虫笔记2 – Requests库实战 Python 网络爬虫系列笔记是笔者在学习嵩天老师的<Python网络爬虫与信息提取>课程及笔者实践网络爬虫的笔记. 课程链接:P ...
- Python 网络爬虫笔记1 -- Requests库
Python 网络爬虫笔记1 – Requests库 Python 网络爬虫系列笔记是笔者在学习嵩天老师的<Python网络爬虫与信息提取>课程及笔者实践网络爬虫的笔记. 课程链接:Pyt ...
- python beautifulsoup库_Python爬虫系列:BeautifulSoup库详解
点击上方蓝字关注"程序员Bob"呀~ 每个人的生命都是通向自我的征途,是对一条道路的尝试,是一条小径的悄然召唤.人们从来都无法以绝对的自我之相存在,每一个人都在努力变成绝对自我,有 ...
- 小猪的Python学习之旅 —— 10.三分钟上手Requests库
小猪的Python学习之旅 -- 10.三分钟上手Requests库 标签:Python 一句话概括本文: 本节讲解Requests库的常见使用,以及一个实战项目: 扒取某一篇微信文章里所有的图片,视 ...
- 爬虫笔记(一)——Requests库
文章目录 写在前面 一.Requests库入门 1.Requests库的安装 (1)安装Requests库 (2)测试Requests库 2.Requests库的get()方法 (1) get()方法 ...
- pythonrequests爬虫外文文献_Python爬虫(一):爬虫介绍、Requests库介绍及实例-Go语言中文社区...
本文主要内容: 1.爬虫的相关概念. 2.Requsets库安装. 3.Requests库介绍. 4.爬取网页的通用代码框架. 1.爬虫相关概念. 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社 ...
- python3爬虫实战:requests库+正则表达式爬取头像
python3爬虫实战:requests库+正则表达式爬取头像 网站url:https://www.woyaogexing.com/touxiang/qinglv/new/ 浏览网页:可以发现每个图片 ...
- python爬虫requests库_python爬虫基础教程:requests库(二)代码实例
get请求 简单使用 import requests ''' 想要学习Python?Python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载! ''' respons ...
- python爬图片代码大全_爬虫入门教程⑩— 用漂亮的图表展示爬取到的数据
经过了前面的努力,我们成功获取到了数据,并且学会了保存,但是只是用网页展示出来,是不是有一些不够美观呢? 所以本节的内容是:数据的可视化.拿到了数据却不能使其简单易懂并且足够突出,那就是不是好的数据工 ...
最新文章
- linux定时任务简记
- 复习计划15.4.24(待完善)
- C++ Primer 5th笔记(chap 13 拷贝控制) 实例1测试和结果分析
- PCB学习第一节内容整理
- 全国翻译专业资格(水平)考试
- cmake 学习笔记
- Android的手势识别
- 无人驾驶入门(影子测试)
- 华为机试HJ5:进制转换
- HTML标记语言——表单的详细使用说明
- uva11992-Fast Matrix Operations(区间增值、改值)
- java 序列号怎么获取,Java获得硬盘和主板的序列号代码
- 第八章:项目质量管理 - (8.0 项目质量管理是什么)
- NC如何在打印模板中添加打印审批流记录
- a轮b轮c轮天使轮区别是什么?
- 使用scratch结合Dsbot机器人做一个抢答器!
- vue--实现学生信息管理案例
- UE4 蒙太奇 组合动画
- Android特别的数据结构(二)ArrayMap源码解析
- 趣味闹钟,社区化讨论
热门文章
- [原创] hadoop学习笔记:wordcout程序实践
- Linux TCP拥塞控制算法原理解析
- div:给div加滚动栏 div的滚动栏设置
- 利用sql报错帮助进行sql注入
- 【leetcode】Best Time to Buy and Sell Stock
- 使用Flex4容器若干技巧
- 我的centos上安装 jdk+apache+tomcat+tomcatconnector+myql 安装道路
- Linux常用命令速查备忘(包括我)
- [导入]★ 你知道JavaScript里数组的最大长度允许多少吗 ★
- android gc 回调,android - 使用Picasso通过Bitmap获取回调