自学Python的时候看了不少老男孩的视频,一直欠老男孩一个会员,现在99元爬虫集训果断参与。

非常喜欢Alex和武Sir的课,技术能力超强,当然讲着讲着就开起车来也说明他俩开车的技术也超级强!

以上是闲扯,开始正式话题。

-----------------------------------------------华丽的分割线--------------------------------------------------

爬虫是什么

百度上是这样讲的。

网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫

通俗的讲,爬虫就是能够自动访问互联网并将网站内容下载下来的的程序或脚本,类似一个机器人,能把别人网站的信息弄到自己的电脑上,再做一些过滤,筛选,归纳,整理,排序等等。

网络爬虫的英文即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。

Python爬虫用到的第三方库

主要有:Requests, Re,BS4, Lxml, Scrapy等

第一章主要是使用Requests, Re 和 BS4

Requests库是由著名的Python界的大神Kenneth Reitz开发的,他同时也是Pipenv的作者,牛人就是牛呀!

关键是人家不仅代码写的好,减肥也减的好呀!以下两张图,大家可以对比下。

Requests主要用来发送请求(get, post等)获取Response,然后使用re正则匹配提取内容,或者使用BS4、Lxml进行解析提取需要的内容。具体用法就不在这里罗列了,传送门如下。

Requests官方文档

BeautifulSoup4官方文档

Lxml官方文档

学习心得

写代码这个事,重要的还是自我学习能力和解决问题的能力。自己仍然要加油。老男孩的Python课程讲得真是好,赞赞赞

有时候大家问问题可能会被人拒绝,看看下边的图,安慰下玻璃心,重要的还是要自己加油哈!

转载于:https://www.cnblogs.com/tianrunzhi/p/9270048.html

路飞学城-Python爬虫集训-第一章相关推荐

  1. 路飞学城python电子书_路飞学城-Python开发集训-第一章

    路飞学城-Python开发集训-第一章 1.本章学习心得.体会 我: 间接性勤奋. 我: 学习方法论:输入--输出---纠正 我: 对对对 走出舒适区, 换圈子, 转思路,投资自我加筹码. 我: 圈子 ...

  2. python绘制路飞_路飞学城-Python开发集训-第一章

    一.学习体会 学习本章的最大体会是终于搞明白,高级语言中编译型与解释型的区别和含义,因为之前看过一些视频,对基础知识还是比较熟悉,所以学起来不费什么力,不过金角大王说越往下内容越多,一定要加油学完8章 ...

  3. python全栈开发实战 路飞学城_路飞学城-python开发集训-第一部分

    本节学习了python的基本操作,如运算.输出等 能实现简单的登录程序 数据类型: 数字: int:整数.长整数(python2为long) float:浮点型 复数型 字符串: 单引号.双引号没有区 ...

  4. 路飞学城—Python爬虫实战密训班 第三章

    路飞学城-Python爬虫实战密训班 第三章 一.scrapy-redis插件实现简单分布式爬虫 scrapy-redis插件用于将scrapy和redis结合实现简单分布式爬虫:- 定义调度器- 定 ...

  5. 路飞学城-Python爬虫实战密训-第1章

    正式的开始学习爬虫知识,Python是一门接触就会爱上的语言.路飞的课真的很棒,课程讲解不是告诉你结论,而是在告诉你思考的方法和过程. 第一章,学习了如何爬取汽车之家以及抽屉登录并点赞. 1 impo ...

  6. 路飞学城-python爬虫密训-第二章

    (一)学习心得 第二章的python爬虫密训,又有新的模块Flask,time,re(正则表达式):这次是一步步去爬取web微信的相关信息,怎么讲,也许自己没有前期网页开发相关学习,学习有点难度,希望 ...

  7. 路飞学城-Python 爬虫实战密训-第 1 章

    本节学习体会: 鸡汤心得: 1.时代发展太快,要不断学习新东西,武装自己,才能跟得上时代的潮流,不然就是面临被pass的命运 2.要看清楚趋势,不要闭门造车 3.学习编程语言就跟学英语一样,方法很重要 ...

  8. 路飞学城-python爬虫密训-第三章

    (一)学习心得 其实在没有正式学习python编程语言中,就知道模块是python最重要部分之一.虽然在前面HTTP协议跟IO多路复用都没有接触学的也是一知半解,scrapy模块比resquests模 ...

  9. 路飞学城-Python开发集训-第2章

    1.本章节学习了列表,对python有了更深一层的了解. 2.学习总结: 二进制: 狼烟大法:17根烟算出131072(算完你已经挂了吧,老师= =!) 1024   512   256   128  ...

最新文章

  1. myeclipse10安装了activiti插件后创建BPMN 文件时报错,
  2. DevOps的几个场景
  3. 我删删删删库了,要跑路吗?
  4. c++标准库中,含有链表的类list
  5. Oracle中计算两个时间的时间差:
  6. 字符串输出为什么第一个没了_「课堂笔记」Python基础语法:变量和输入输出
  7. 图像处理十:图像反色
  8. Linux进程调度技术的前世今生
  9. 安装pyltp遇到的问题
  10. uva 10098 生成字典续序列
  11. 木门代理商利用微信营销让自己的事业更上一层楼
  12. VMware虚拟机 centos8 解决全屏问题
  13. php博客平台 开源,PHP开源博客Blog - PHP开源网(PHP-OPEN.ORG)
  14. 如何使用小米手机对文档进行扫描
  15. cdh3.6.2集成zeppelin0.10.1及简单使用
  16. 【笑话】程序员的幽默,你可能看不懂 。。。
  17. 编写程序,输入本金、年利率和年份,计算复利(结果保留2位小数)
  18. 村庄规划工作底图制作
  19. excel中的高级筛选
  20. 如何通俗理解海涅定理

热门文章

  1. C语言之预处理探究(一):宏
  2. 最后的战线java下载_最后战线2.0游戏
  3. 第一代电子计算机主机是,以 计算机主机是由CPU与哪种设备共同构成的 为第一题的100道题的答案...
  4. 通讯录c语言以文本文件保存,学C三个月了,学了文件,用C语言写了个通讯录程序...
  5. Java8collection.sort_Collections.sort()源码分析(基于JAVA8)
  6. C语言关系运算符及其表达式
  7. python 分词nlp,学习NLP的第四天——hanlp字典分词的Python实现,4,HanLP,词典
  8. python 组合数_python – 查找两个数组元素的最大有效组合数
  9. 装了python3但在cmd里不识别,Pip无法识别安装命令(Windows 7,Python 3.3)
  10. html里面注释浮动框,“浮动”注释与HTML / CSS / JavaScript /任何