路人甲 ,教你如何编程
190 人赞同

第一:Python爬虫学习系列教程(来源于某博主:http://cuiqingcai.com/1052.html)

Python版本:2.7

整体目录:

一、爬虫入门

1. Python爬虫入门一之综述

2. Python爬虫入门二之爬虫基础了解

3. Python爬虫入门三之Urllib库的基本使用

4. Python爬虫入门四之Urllib库的高级用法

5. Python爬虫入门五之URLError异常处理

6. Python爬虫入门六之Cookie的使用

7. Python爬虫入门七之正则表达式

二、爬虫实战

1. Python爬虫实战一之爬取糗事百科段子

2. Python爬虫实战二之爬取百度贴吧帖子

3. Python爬虫实战三之实现山东大学无线网络掉线自动重连

4. Python爬虫实战四之抓取淘宝MM照片

5. Python爬虫实战五之模拟登录淘宝并获取所有订单

6. Python爬虫实战六之抓取爱问知识人问题并保存至数据库

7. Python爬虫实战七之计算大学本学期绩点

8. Python爬虫实战八之利用Selenium抓取淘宝匿名旺旺

三、爬虫利器

1. Python爬虫利器一之Requests库的用法

2. Python爬虫利器二之Beautiful Soup的用法

3. Python爬虫利器三之Xpath语法与lxml库的用法

4. Python爬虫利器四之PhantomJS的用法

5. Python爬虫利器五之Selenium的用法

6. Python爬虫利器六之PyQuery的用法

四、爬虫进阶

1. Python爬虫进阶一之爬虫框架概述

2. Python爬虫进阶二之PySpider框架安装配置

3. Python爬虫进阶三之爬虫框架Scrapy安装配置

4. Python爬虫进阶四之PySpider的用法

第二(第一的姊妹篇):Python爬虫入门教程(来源于博主:blog.csdn.net/column/details/why-bug.html)

Python版本:2.7

教程目录:

[Python]网络爬虫(一):抓取网页的含义和URL基本构成

[Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容

[Python]网络爬虫(三):异常的处理和HTTP状态码的分类

[Python]网络爬虫(四):Opener与Handler的介绍和实例应用

[Python]网络爬虫(五):urllib2的使用细节与抓站技巧

[Python]网络爬虫(六):一个简单的百度贴吧的小爬虫

[Python]网络爬虫(七):Python中的正则表达式教程

[Python]网络爬虫(八):糗事百科的网络爬虫(v0.3)源码及解析(简化更新)

[Python]网络爬虫(九):百度贴吧的网络爬虫(v0.4)源码及解析

[Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)

[Python]网络爬虫(11):亮剑!爬虫框架小抓抓Scrapy闪亮登场!

[Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程

第三:你已经看完上面(第一或者第二)的教程:再推荐知乎用户@陈唯源 的实战练习博客

Python爬虫学习记录(1)——Xiami全站播放数

Python爬虫学习记录(2)——LDA处理歌词

百度音乐带标签,作曲,演唱者,类别的歌词数据

Python爬虫学习记录(4)——传说中的足彩倍投法。。好像也不是那么靠谱

2011~2013.5全球所有足球比赛比分数据以及足彩各公司盘口

Python爬虫学习记录(3)——用Python获取虾米加心歌曲,并获取MP3下载地址

Python爬虫学习记录(5)——python mongodb + 爬虫 + web.py 的acfun视频排行榜

Python爬虫学习记录(0)——Python 爬虫抓站 记录(虾米,百度,豆瓣,新浪微博)

第四:最后推荐知乎用户@gaga salamer 的实战练习博客

爬虫教程(1)基础入门

爬虫教程(2)性能进阶

知乎用户信息爬虫(规模化爬取)

用scrapy爬取豆瓣电影新片榜

用scrapy对豆瓣top250页面爬取(多页面爬取)

用scrapy自动爬取下载图片

用scrapy自动下载石原sama的豆瓣影人图集(727张图片,自动下载)

希望以上的教程可以帮助到大家。

如果你想学习编程,但是找不到学习路径和资源,欢迎关注专栏:学习编程

如何一步一步的学Java - 知乎专栏
C、C++语言学习资料 - 知乎专栏
学好Python的11个优秀资源 - 知乎专栏
程序员把妹指南之修电脑篇 - 知乎专栏
编程教程资源整理汇总- 知乎专栏
免费实用的API接口 - 知乎专栏
零基础如何开发游戏 - 知乎专栏
代码编辑器的配色方案 - 知乎专栏

编辑于 昨天 17:32 13 条评论 感谢

分享

收藏 • 没有帮助 • 举报 • 作者保留权利

21赞同 反对,不会显示你的姓名
黄哥 ,帮你从不会写代码到会写代码解决问题的过…
21 人赞同

首先要自己会写代码。

学习爬虫可以从下面一些知识点入手学习。
1、http相关知识。
2、浏览器拦截、抓包。
3、python2 中编码知识,python3 中bytes 和str类型转换。
4、抓取javascript 动态生成的内容。
4、模拟post、get,header等
5、cookie处理,登录。
6、代理访问。
7、多线程访问、python 3 asyncio 异步。
8、正则表达式、xpath等
等等。。。。
还有scrapy requests等第三方库的使用。
请看看
Python爬虫联想词视频和代码 - 通过python学会编程 - 知乎专栏

from: https://www.zhihu.com/question/47883186#answer-39492949

零基础如何学爬虫技术?相关推荐

  1. 零基础学python爬虫-零基础如何学爬虫技术?一篇带你入门!(理论+实操+荐书)...

    对于小白来说,爬虫可能是一件非常复杂.技术门槛很高的事情. 但掌握正确的方法,在短时间内做到能够爬取主流网站的数据,其实非常容易实现! 同时,你需要从一开始就有一个具体的目标!只有在目标的驱动下,你的 ...

  2. 零基础转行学编程技术难吗?

    编程并没有想象中的那么高不可得~而是可以通过自己的学习,进入到这个行业里.其实不光是刚毕业的学生有这样的担忧,想要转行的也有同款担忧,毕竟隔行如隔山. 多久能学会编程?知识点可以在短时间内了解,但是思 ...

  3. python爬虫教程入门-零基础入门Python爬虫不知道怎么学?这是入门的完整教程

    原标题:零基础入门Python爬虫不知道怎么学?这是入门的完整教程 这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑 ...

  4. python零基础入门教程-零基础入门Python爬虫不知道怎么学?这是入门的完整教程...

    原标题:零基础入门Python爬虫不知道怎么学?这是入门的完整教程 这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑 ...

  5. 0基础学python难吗-零基础入门学习Python技术难不难?

    原标题:零基础入门学习Python技术难不难? 近几年对python人才爆发式需求,导致很多人转行进入python开发行业,现如今Python这门语言的就业前景会非常好.相对于其他来说,它语法简单易读 ...

  6. python爬虫ppt_完全零基础 轻松学Python:数据类型:数字类型、空类型、布尔类型...

    Tip:点击上方或此处 "#完全零基础 轻松学Python" 话题,查看更多内容,欢迎点赞.分享.收藏,谢谢支持! 内 容 概 要 1. 数据类型概述 数据类型的概念.常见的八种数 ...

  7. 零基础学python难吗-零基础入门学习Python技术难不难?

    原标题:零基础入门学习Python技术难不难? 近几年对python人才爆发式需求,导致很多人转行进入python开发行业,现如今Python这门语言的就业前景会非常好.相对于其他来说,它语法简单易读 ...

  8. 零基础可以学python吗-Python编程语言好学吗?零基础转行能学Python吗?

    Python编程语言好学吗?零基础转行能学Python吗?人工智能时代的来临催生了很多新兴行业,Python是最具代表性也是比较热门的技术之一.有人看好Python入门简单.功能强大的特性,选择转行从 ...

  9. python零基础能学吗-Python编程语言好学吗?零基础转行能学Python吗?

    Python编程语言好学吗?零基础转行能学Python吗?人工智能时代的来临催生了很多新兴行业,Python是最具代表性也是比较热门的技术之一.有人看好Python入门简单.功能强大的特性,选择转行从 ...

最新文章

  1. LeetCode Remove Duplicates from Sorted List
  2. 一招搞定css页面布局
  3. jna enum 对应 java_JNA简单使用
  4. PCL学习笔记01:在Ubuntu上安装PCL
  5. quidway secpath下搭建DHCP服务器01
  6. 音效SystemSoundID
  7. UVA11424 GCD - Extreme (I)【欧拉函数打表】
  8. TimescaleDB 简单试用
  9. 黑马程序员——Java基础知识——泛型、枚举
  10. 通过网易云api实现一个简单的音乐播放器
  11. 常用正则表达式大全(Xss防范、sql注入、手机邮箱验证等等,持续补充~)
  12. mysql analyze_MySQL中的analyze与optimize
  13. NeRF 神经辐射场
  14. 名帖59 褚遂良 小楷《千字文》
  15. SQL入门之第七讲——INSERT插入语句
  16. java网络学习之 PKCS标准 X.509标准 证书等概念 的汇总(16)
  17. Android之MediaPlayer播放网络视频的实现方法
  18. 0基础小白该如何学Python?这些方法你需要了解
  19. 磁盘不足怎么办?LVM逻辑卷与磁盘配额请求出战!
  20. [Pandas 学习笔记] - No.1 pandas学习笔记

热门文章

  1. 【采用】知识图谱简介及风控应用场景
  2. Facebook最新Libra币开发指南---接口服务器开发2
  3. 支持向量机:Outliers
  4. Visual Studio 2013开发 mini-filter driver step by step (3) - 查看运行结果
  5. jvm性能调优实战 - 25模拟在Young GC过后因为放入下Survivor区域直接进入老年代
  6. Spring-AOP @AspectJ进阶之绑定类注解对象
  7. Spring-基于Spring使用自定义注解及Aspect实现数据库切换
  8. 64 oracle client,64bit oracle and oracle client.
  9. 学习笔记Spark(四)—— Spark编程基础(创建RDD、RDD算子、文件读取与存储)
  10. spring boot jpa级联保存