9点49,老婆孩子都睡着了, 继续搞。

第1篇写了访问百度并打印页面源码,似乎没什么实际意义,这次弄个有点用的,就是百度中输入指定关键词后搜索,然后获取搜索结果第一页(翻页后面会陆续写)。

比如我们输入‘博客园’,下面是查询结果(为啥写博客园不写CSDN呢,因为最早是博客是在博客园里写的,现在自己转发到CSDN,不改了):

这个时候我们看下浏览器中url地址 ,大概是这个样子的

好老长,我们去除掉一些看不懂的部分,只保留ie 和wd 这2个参数试下能否正常访问

可以的访问,现在我们把这个url复制到 代码中看下

https://www.baidu.com/s?ie=utf-8&wd=%E5%8D%9A%E5%AE%A2%E5%9B%AD

发现变化了没,wd=博客园 变成了 wd= %E5%8D%9A%E5%AE%A2%E5%9B%AD,这个是浏览器对url做了编码转换。

所以当写爬虫时也需要将含中文或者特殊字符的关键词参数做编码转换,上代码:
复制代码

from urllib.request import urlopen
from urllib.request import Request
from fake_useragent import UserAgent
from urllib.parse import urlencode#设置request header
ua = UserAgent()
headers = {"User-Agent":ua.random
}#拼接url
args = {"ie":"utf-8","wd":"博客园"
}
url = "https://www.baidu.com/s?{}".format(urlencode(args))#封装request
request = Request(url,headers=headers)# 发送请求,获取服务器给的响应
response = urlopen(request)# 读取结果,无法正常显示中文
html = response.read()# 进行解码操作,转为utf-8
html_decode = html.decode()# 打印结果
print(html_decode)

爬虫-python(三) 百度搜索关键词后爬取搜索结果相关推荐

  1. 爬虫-requests库(二)get请求参数的使用 —搜狗搜索后爬取搜索结果

    之前写过一个用urllib.request 爬取百度搜索后结果的小文章 百度搜索关键词后爬取搜索结果 这次用requests库实现下搜狗搜索后查询,代码 import requests from fa ...

  2. python爬虫学习(三):使用re库爬取淘宝商品,并把结果写进txt文件

    第二个例子是使用requests库+re库爬取淘宝搜索商品页面的商品信息 (1)分析网页源码 打开淘宝,输入关键字"python",然后搜索,显示如下搜索结果 从url连接中可以得 ...

  3. 爬虫python教程百度云_《爬》字意思读音、组词解释及笔画数 - 新华字典 - 911查询...

    基本词义 ◎ 爬 pá 〈动〉 (1) (形声.从爪,巴声.爪,手爪.本义:搔,爬梳) (2) 同本义 [scratch] 爬,搔也.--<广韵> 怯烦类决痈,惬兴剧爬疥.--韩愈等< ...

  4. 【Python爬虫教学】百度篇·手把手教你抓取百度搜索关键词后的页面源代码

    [开门见山] 最近整理了下之前做过的项目,学的东西不少,乱七八糟.打算写点关于 Python 爬虫的东西,新人一枚,还望大佬们多多担待,别把我头给打歪了. 前面我先磨叽磨叽些基础的东西,对爬虫新人友好 ...

  5. Python爬虫:运用多线程、IP代理模块爬取百度图片上小姐姐的图片

    Python爬虫:运用多线程.IP代理模块爬取百度图片上小姐姐的图片 1.爬取输入类型的图片数量(用于给用户提示) 使用过百度图片的读者会发现,在搜索栏上输入关键词之后,会显示出搜索的结果,小编想大多 ...

  6. python3爬虫系列03之requests库:根据关键词自动爬取下载百度图片

    python3爬虫系列03之requests库:根据关键词自动爬取下载百度图片 1.前言 在上一篇文章urllib使用:根据关键词自动爬取下载百度图片 当中,我们已经分析过了百度图片的搜索URL的变化 ...

  7. python爱心代码_百度搜索指数的爬取方法及代码

    最近几年经常在各平台看到有关「搜索指数动态排行」的视频,比如「青春有你2」决赛前一周,我在B站上传了一段「青你2」和「创造营2020」的人气选手指数动态榜的视频: 「青春有你2」VS「创造营2020」 ...

  8. Python爬虫实例(2)-用BeautifulSoup爬取一个网页上的多张照片(以百度贴吧为例)

    上一篇博客,实现了下载一张图片的简单爬虫.但是其代码,仅仅能下载一张图片.爬虫作为数据分析的第一步工作,需要爬取的是海量数据:假设我想下载一个网站几十张图片,那怎么实现呢? 首先,我们利用框图或者伪代 ...

  9. Python实践 - 网络爬虫笔记 - 2、从网站上爬取公开信息

    Python实践笔记 - 2.从网站上爬取公开信息 张板书的Python的实践笔记,包括笔记与DeBug的经历. 为了完成一个比较麻烦的实习任务,尝试着做了这样一个爬虫项目. 任务要求之一是要检索安徽 ...

  10. 爬虫入门—requests模块基础之关键字搜狗搜索信息页面爬取

    爬虫入门-requests模块基础之关键字搜狗搜索信息页面爬取 Author: Labyrinthine Leo   Init_time: 2021.02.16 Key Words: Spider.r ...

最新文章

  1. 你之所以没成为成就,就是因为太刻苦了!
  2. Numpy:数组合矢量计算
  3. python docx 复制_99%的人都不知道的Python整理文件方法,效率提升100倍
  4. js实现对象完美克隆
  5. Redis学习笔记之二 :在Java项目中使用Redis
  6. call()、apply()、bind()
  7. 玩点创意编程,发现另一个世界
  8. 二维数组m的元素是4个字符组成的串_串、数组和广义表
  9. 织梦dedecms财务会计代理记账财税公司网站模板 带手机版
  10. 凝思系统改时间_大众改原厂盲点监测系统,中山大众原厂改装,途观L改盲点监测...
  11. 【2017-04-16】抽象类、接口、构造函数、重载和重写的区别、静态成员和方法
  12. 将vscode改成中文界面
  13. 入行网络工程师一年的心得体会
  14. SSO单点登录系统解决方案
  15. 项目管理手记(八) SaaS模式的DRP系统是否适用?
  16. 安全生产知识竞赛试题库及答案
  17. 最简单的 DRM 应用 drm设备不工作
  18. 实战:618/双11大促备战全流程点点滴滴
  19. Java静态编译技术:突破Java“冷启动”桎梏,实现启动性能“质”的飞跃
  20. 【亲测可用】经验分享,开发在线考试平台(类似问卷星、考试星、阿里巴巴在线考试、易考通、考试云、移动网大、移动网校、中石化网络学院、宝武微学院、iTEST等)如何用程序代码防止学生作弊?

热门文章

  1. 复合类型(json)
  2. office 复合文档数据结构解析“初探”
  3. linux dx游戏,10大免费 Linux 游戏
  4. layui 模板引擎-laytpl(局部渲染)
  5. mysql查询出现ambiguous的问题
  6. 计算机控制plc应用论文,PLC自动控制系系统在变频器中的运用
  7. 2019年广东当代优质民办学校获奖名单公布
  8. 动力电池SOC估算方法综述
  9. mdf导入虚拟主机mysql_MYSQL导入mdf文件
  10. python有道云笔记_GitHub - IthacaDream/youdaonote-pull: 一个一键导出 / 备份「有道云笔记」所有笔记的 Python 脚本...