一起学爬虫(Python) — 19 年轻人,进来学自动化

今天要学会爬

  • requests模块
    • 什么是requests模块
    • 如何安装requests模块
    • 怎么用requests模块
  • 实战!

requests模块

什么是requests模块

大家好鸭,今天是写博客的第二天,昨天写的结果只有不几个人看了呢,不过还有两个小伙伴点赞了,真的是万分感谢!!!

希望各位看客能多多提意见还有提问题哦,小泽都会努力解答的~
咳咳,开始今天的正题:requests模块。
如果学过python基础的话就会知道模块是个什么东西,没有学过直接来这里看的呢,也应该大致知道模块是个什么东东,就是类似于数学公式的存在,不需要繁琐的计算,直接套用公式的那种感觉。
那么,什么是requests模块呢?
python自带的一款基于网络请求的模块,功能强大,效率极高!
一个字,牛逼!!
总之你不会写不理解的东东,这个模块统统都给你解决喽,你只需要一句话,一个词就可以直接调用一大堆神奇的指令~

如何安装requests模块

环境安装:

    pip install requests


我的系统是win7的,不过推荐各位用win10系统,在下是因为贫穷…咳咳,还有如果用的是pycharm的话,安装模块要在……


找到上图所示的目录Project–>Project interpreter,然后点击右上角的加号。

搜索requests,然后点击左下角的install Package进行下载,成功了下面会提示你绿了(有个绿条条)
这里我已经下载过了,所以各位自行下载吧~

怎么用requests模块

如果上面的步骤都准备好了,那么恭喜你,可以开始爬了!
当然可能会有些小伙伴会报错呀报错呀报错呀之类的,没事,把问题留言一下,小泽看到了会及时回复的~
那么,光看不做可不行,知道了理论知识,也要会实践,对吧。
在那之前先了解一下requests模块干事的四个步骤,然后敲代码的时候要想着这四个步骤,一步一步来,稳住,不要浪!
1.指定url(发现敌军位置)
2.发起请求(请求使用意大利炮)
3.获取响应数据(开炮!)
4.持久化存储(收拾战场)

后面的比喻可能不那么精准哈…不过大概意思就是这样,要知道,requests模块是模拟我们去上网,所以要从我们自己的角度去给requests模块施加命令,不能一步登天哈。

实战!

首先啊,不管干什么,要先记住一件事,导入模块!

#导入requests模块
import requests

1.指定url
那我们随便找一个网站去试一试,随便找啊,比如说百度吧。
www.baidu.com

#1:指定url
url='https://www.baidu.com/'

各位会不会觉得百度很厉害,一定爬不下来?
给我爬!

#2:发起请求(get方法会返回一个响应对象)
response = requests.get(url=url)

这一步大家应该都看得懂吧,requests.get()是一个方法,里面要指定url,爬也得爬对地方对吧。response则是接受了requests.get()方法爬取回来的数据,就是响应对象,很专业的名词啊,但是没关系,知道就好了。

#3:获取响应数据
page_text = response.text

到了第三步喽,这个时候已经爬回东西来了,进去了又出来,那还进不进去都无所谓了,毕竟东西已经爬到了,接下来就是把这个东西转换成我们能看得懂的数据,当然你也可以自己把response打印一下,看一看对吧,要多动手实践才能知道为什么要这么做的,不要光我说什么就是什么了。
.text就是把response转换成了文本格式,然后又把数据给了page_text,这里为什么要用page_text呢,因为高级啊!别人看不懂就会显得很高级~

#4:持久化存储
with open('./baidu.html','w',encoding='utf-8') as fp:fp.write(page_text)
print('爬完了')

最后一步,把我们爬取到的东西保存下来,这个大家应该都能理解,突然觉得很简单吧,这就是爬虫!
但是程序员会让你这么简单的爬下来吗那些重要数据吗?答案肯定是No!所以为了爬取美女图片,我们要更加努力学习!
明天,我们就来使自己更强大!
至少得爬取到我们想要的东西,对吧。
那今天就到这里啦,各位看官早点睡吧,晚安~

一起学爬虫(Python) — 02相关推荐

  1. 老司机带你学爬虫——Python爬虫技术分享

    什么是"爬虫"? 简单来说,写一个从web上获取需要数据并按规定格式存储的程序就叫爬虫: 爬虫理论上步骤很简单,第一步获取html源码,第二步分析html并拿到数据.但实际操作,老 ...

  2. 01-为什么要学爬虫-python小白爬虫入门教程

    学习目的以及需求 需求来自于:抓取的某个网站或者某个应用的内容,提取有用的价值 实现手段 模拟用户在浏览器或者应用(app)上的操作,实现自动化的程序 爬虫应用场景(利用爬虫能做什么?) 大家最熟悉的 ...

  3. python初学者web还是爬虫-还在纠结学爬虫还是数据分析,不如看看这篇文章

    原标题:还在纠结学爬虫还是数据分析,不如看看这篇文章 身为职场人,收集上万条表格数据做商业分析,裁剪上千张图片,发送数百封邮件...这些都是经常会遇到的场景.我一直期待能有个工具解放我,直到我遇到了P ...

  4. python好学嘛-爬虫Python入门好学吗?学什么?

    爬虫Python入门好学吗?学爬虫需要具备一定的基础,有编程基础学Python爬虫更容易学.但要多看多练,有自己的逻辑想法.用Python达到自己的学习目的才算有价值.如果是入门学习了解,开始学习不难 ...

  5. 路飞学城—Python爬虫实战密训班 第三章

    路飞学城-Python爬虫实战密训班 第三章 一.scrapy-redis插件实现简单分布式爬虫 scrapy-redis插件用于将scrapy和redis结合实现简单分布式爬虫:- 定义调度器- 定 ...

  6. python是什么意思中文、好学吗-爬虫Python入门好学吗?学什么?

    爬虫Python入门好学吗?学爬虫需要具备一定的基础,有编程基础学Python爬虫更容易学.但要多看多练,有自己的逻辑想法.用Python达到自己的学习目的才算有价值.如果是入门学习了解,开始学习不难 ...

  7. 从业老学姐Python经验分享,别再相信培训机构“爬虫好学”的鬼话了,少走弯路!

    嗨~我是小鱼 前言 相信很多小伙伴在学习编程时都会去网络上搜索资料,寻找一些前辈的学习方法.这样的开始未尝不可,但是,在搜索的过程中你会惊讶的发现,网络上铺天盖地的"三个月速成python& ...

  8. 一起学爬虫(Python) — 10

    一起学爬虫(Python) - 19 年轻人,进来学自动化 高效爬取美丽的图片 任务目标 任务流程 step1:复制 step2:粘贴 step3:重学异步 什么是异步 勤奋的小明 理解小明 理解~~ ...

  9. Python爬虫是个啥?学了Python爬虫有什么用?

    什么是Python爬虫 Python爬虫即使用Python程序开发的网络爬虫(网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.爬虫指一段自动抓取互联网信息的程序,从互 ...

  10. Python爬虫的起点!学爬虫从起点开始!

    第一章主要讲解爬虫相关的知识如:http.网页.爬虫法律等,让大家对爬虫有了一个比较完善的了解和一些题外的知识点. 今天这篇文章将是我们第二章的第一篇,我们从今天开始就正式进入实战阶段,后面将会有更多 ...

最新文章

  1. 各领域机器学习数据集汇总
  2. C语言sscanf()函数(从字符串读取格式化输入,提取需要的信息)
  3. Spring AOP(一):概览
  4. ZZULIOJ 1075: 聚餐人数统计
  5. rdd分片 spark_大数据面试题(Spark(一))
  6. 关于ORACLE数据传输加密的介绍
  7. php学校成员,php访问成员变量和成员方法
  8. html图片使用glide,jQuery响应式幻灯片插件jquery.glide.js(支持触摸轻量级)
  9. coredata 自动化刷新uitableview数据
  10. TimeUnit类中的sleep() 和Thread.sleep()
  11. Struts中s:checkboxlist的用法
  12. Atitit 局部图查找大图 方法 与 说明
  13. 有关C++的标准模板库(STL)的一些个人易错点
  14. html app5 仿微信朋友圈,uniapp仿微信聊天App界面|仿微信朋友圈|uniapp仿微信
  15. 宽高变化动画代码,旋转动画代码(HTML5)
  16. filevault(电子仓库)自动切换文件夹以及文档最大值设置
  17. 2022-2028年中国电子级醋酸行业市场调查研究及投资策略研究报告
  18. Shop项目后台--4.所有订单的订单详情/admin/order/list.jsp
  19. html简单的文字自动出现效果,8个华丽的HTML5文字动画特效赏析
  20. Revit一款主要用于进行建筑信息建模的软件

热门文章

  1. MATLAB linspace函数
  2. 弘辽科技:拼多多直通车测款是怎样操作的
  3. Lumerical---FDTD仿真区域设置问题
  4. 中华石杉Java面试突击第一季笔记一(消息队列)
  5. 什么是主数据?什么是主数据管理系统?
  6. md5加密算法~Java语言实现
  7. 锂电池容量下降怎么办?锂电池容量下降修复方法
  8. JavaScript字符串的长度
  9. 【背包问题】完全背包问题
  10. Win10 磁盘被写保护 请去掉写保护或使用另一张磁盘