爬虫-requests库(二)get请求参数的使用 —搜狗搜索后爬取搜索结果
之前写过一个用urllib.request 爬取百度搜索后结果的小文章
百度搜索关键词后爬取搜索结果
这次用requests库实现下搜狗搜索后查询,代码
import requests
from fake_useragent import UserAgent#定义url
url = "https://www.sogou.com/web"#设置request header
ua = UserAgent()
headers = {"User-Agent":ua.random
}#交互输入关键字,封装至参数
kw = input('enter a key word:')
params = {"query":kw
}# 发送请求,获取服务器给的响应
response = requests.get(url=url,params=params,headers=headers)#数据存储
with open('./file/'+ kw + '.html','w',encoding='utf-8') as fw:fw.write(response.text)
#提示完成
print("爬取完成!")
对比下urllib.request ,增加了params参数,get请求不需要将参数用?参数1=1&参数2=2 这种样式拼接到url,也不需要注意中文的转码,还是很方便的。
爬虫-requests库(二)get请求参数的使用 —搜狗搜索后爬取搜索结果相关推荐
- 已解决(Python爬虫requests库报错 请求异常SSL错误,证书认证失败问题)requests.exceptions.SSLError: HTTPSConnectionPool
成功解决(Python爬虫requests库报错 请求异常,SSL错误,证书认证失败问题)requests.exceptions.SSLError: HTTPSConnectionPool(host= ...
- python get方法列表参数_python中requests库get方法带参数请求
起因是想爬五等分的花嫁的漫画.这是其中的一个坑 先上代码 data={ 'cid':567464, 'page':, 'key':'', 'language':1, 'gtk':6, '_cid':5 ...
- 【python】python爬虫requests库详解
1.安装:pip install requests 简介:Requests是一个优雅而简单的Python HTTP库,与之前的urllibPython的标准库相比,Requests的使用方式非常的简单 ...
- 接口测试 — 使用Requests库发送POST请求
POST请求用于向服务器提交数据,比如提交一个表单新建一个用户.或修改一个用户信息等操作. 对于POST请求,我们可以通过浏览器开发者工具或者其他外部工具来进行抓包,得到请求的URL.请求头(requ ...
- Python爬虫——Requests 库基本使用
文章目录 Python爬虫--Requests 库基本使用 1.Requests简介和下载 2.Requests 库基本使用 Python爬虫--Requests 库基本使用 1.Requests简介 ...
- 知乎使用爬虫时报10001:请求参数异常,请升级客户端后重试 怎么搞?
前言: 在使用puppeteer自动爬取知乎上数据的时候,在登录的时候会报错: 10001:请求参数异常,请升级客户端后重试... 相信很多人在爬取知乎数据的时候也会碰到类似的问题,怎么解决呢? 解 ...
- 爬虫实战系列!淘宝店铺各品牌手机售卖信息爬取及可视化!
声明:本博客只是简单的爬虫示范,并不涉及任何商业用途. 一.前言 最近博主在浏览淘宝时突然萌发了一个想爬它的念头,于是说干就干,我便开始向淘宝"下毒手"了.由于本人平时经常喜欢在淘 ...
- 爬虫能有多简单?看我三分钟教会你爬取百万图片。
什么是爬虫? 如果是没有接触过爬虫的人可能会有些许疑惑,爬虫是个什么东西呢?其实爬虫的概念很简单,在互联网时代,万维网已然是大量信息的载体,如何有效地利用并提取这些信息是一个巨大的挑战.当我们使用浏览 ...
- 【Python爬虫实例学习篇】——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云
[Python爬虫实例学习篇]--5.[超详细记录]从爬取微博评论数据(免登陆)到生成词云 个人博客地址:ht/tps://www.asyu17.cn/ 精彩部分提醒: (1)微博评论页详情链接为一个 ...
最新文章
- JAVA_SE之内部类
- Jmeter之断言操作
- Spring中的Spring JSR-250 注释
- 测试nb信号的软件_NB-IOT的OTA测试(功率、灵敏度测试)
- activiti 多部门审批_Activiti 基本介绍
- jquey控制元素滚动条,外层div滚动,内层顶部div固定不动
- win10安装wireshark经常报“KB2999226 和 KB3118401”补丁未安装的问题
- 电影中的计算机 过去与未来
- android 悬浮窗口透明,基于popupWindow实现悬浮半透明效果
- iSCSI网络共享存储原理及搭建
- Excel绘制折线图--更新中。。。
- Java 导出 PDF之固定模板导出
- java qq聊天界面_用Java制作一个简单的QQ聊天界面
- CentOS 7.6 部署frps
- 搭建图片网站:通过cpolar发布图片网站 3/3
- 团建游戏----气球大赛
- 新版本微信分享sdk(1.8.3)踩坑实录
- 网上药店需要戴上“紧箍咒”
- APNS推送证书生成与验证
- 金蝶kis记账王凭证过账要不要要审核
热门文章
- keystore/keymaster代码导读系列-ongoing
- java 中几种常用数据结构
- 【技术三千问】之《modbus问题难点解析》,避坑指南!
- 3D视觉|了解下工业上常见的3D相机
- 千锋内部邮件曝光:学员高就业率的背后…
- fcitx只能打繁体字无法切换的一个解决方法linux mint
- 【西门子案例】西门子1200PLC 传送带控制升级版
- 电脑重装详细步骤(win10)
- android读取运动数据权限_Android 计步模块(读取三星S健康步数)
- w ndows远程自动退出登陆,远程桌面连接Wndows 常见故障解决方法.doc