这篇文章已经过去很久了,有一些学习资源链接已经失效了,还一直有小伙伴在Python的路上摸索。所以我根据自己的学习和工作经历整理了一套Python学习电子书,在公众号「路人甲TM」后台回复关键词「1」可以免费获得!

想写这么一篇文章,但是知乎社区爬虫大神很多,光是整理他们的答案就够我这篇文章的内容了。对于我个人来说我更喜欢那种非常实用的教程,这种教程对于想直接上手爬虫做一些小东西的朋友来说是极好的。

用一个精彩的回答作为开头:如何入门 Python 爬虫? - 谢科的回答

如果你想学习编程,但是找不到学习路径和资源,欢迎关注专栏:学习编程

第一:Python爬虫学习系列教程(来源于某博主:http://cuiqingcai.com/1052.html)

Python版本:2.7

整体目录:

一、爬虫入门

1. Python爬虫入门一之综述

2. Python爬虫入门二之爬虫基础了解

3. Python爬虫入门三之Urllib库的基本使用

4. Python爬虫入门四之Urllib库的高级用法

5. Python爬虫入门五之URLError异常处理

6. Python爬虫入门六之Cookie的使用

7. Python爬虫入门七之正则表达式

二、爬虫实战

1. Python爬虫实战一之爬取糗事百科段子

2. Python爬虫实战二之爬取百度贴吧帖子

3. Python爬虫实战三之实现山东大学无线网络掉线自动重连

4. Python爬虫实战四之抓取淘宝MM照片

5. Python爬虫实战五之模拟登录淘宝并获取所有订单

6. Python爬虫实战六之抓取爱问知识人问题并保存至数据库

7. Python爬虫实战七之计算大学本学期绩点

8. Python爬虫实战八之利用Selenium抓取淘宝匿名旺旺

三、爬虫利器

1. Python爬虫利器一之Requests库的用法

2. Python爬虫利器二之Beautiful Soup的用法

3. Python爬虫利器三之Xpath语法与lxml库的用法

4. Python爬虫利器四之PhantomJS的用法

5. Python爬虫利器五之Selenium的用法

6. Python爬虫利器六之PyQuery的用法

四、爬虫进阶

1. Python爬虫进阶一之爬虫框架概述

2. Python爬虫进阶二之PySpider框架安装配置

3. Python爬虫进阶三之爬虫框架Scrapy安装配置

4. Python爬虫进阶四之PySpider的用法

第二(第一的姊妹篇):Python爬虫入门教程(来源于博主:blog.csdn.net/column/details/why-bug.html)

Python版本:2.7

教程目录:

[Python]网络爬虫(一):抓取网页的含义和URL基本构成

[Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容

[Python]网络爬虫(三):异常的处理和HTTP状态码的分类

[Python]网络爬虫(四):Opener与Handler的介绍和实例应用

[Python]网络爬虫(五):urllib2的使用细节与抓站技巧

[Python]网络爬虫(六):一个简单的百度贴吧的小爬虫

[Python]网络爬虫(七):Python中的正则表达式教程

[Python]网络爬虫(八):糗事百科的网络爬虫(v0.3)源码及解析(简化更新)

[Python]网络爬虫(九):百度贴吧的网络爬虫(v0.4)源码及解析

[Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)

[Python]网络爬虫(11):亮剑!爬虫框架小抓抓Scrapy闪亮登场!

[Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程

第三:你已经看完上面(第一或者第二)的教程:再推荐知乎用户

@陈唯源

的实战练习博客

Python爬虫学习记录(1)——Xiami全站播放数

Python爬虫学习记录(2)——LDA处理歌词

百度音乐带标签,作曲,演唱者,类别的歌词数据

Python爬虫学习记录(4)——传说中的足彩倍投法。。好像也不是那么靠谱

2011~2013.5全球所有足球比赛比分数据以及足彩各公司盘口

Python爬虫学习记录(3)——用Python获取虾米加心歌曲,并获取MP3下载地址

Python爬虫学习记录(5)——python mongodb + 爬虫 + web.py 的acfun视频排行榜

Python爬虫学习记录(0)——Python 爬虫抓站 记录(虾米,百度,豆瓣,新浪微博)

第四:最后推荐知乎用户

@gaga salamer

的实战练习博客

爬虫教程(1)基础入门

爬虫教程(2)性能进阶

知乎用户信息爬虫(规模化爬取)

用scrapy爬取豆瓣电影新片榜

用scrapy对豆瓣top250页面爬取(多页面爬取)

用scrapy自动爬取下载图片

用scrapy自动下载石原sama的豆瓣影人图集(727张图片,自动下载)

希望以上的教程可以帮助到大家。

如果你想学习编程,但是找不到学习路径和资源,欢迎关注专栏:学习编程

如何一步一步的学Java - 知乎专栏

C、C++语言学习资料 - 知乎专栏

学好Python的11个优秀资源 - 知乎专栏

程序员把妹指南之修电脑篇 - 知乎专栏

编程教程资源整理汇总- 知乎专栏

免费实用的API接口 - 知乎专栏

零基础如何开发游戏 - 知乎专栏

代码编辑器的配色方案 - 知乎专栏

如何学习Python爬虫[入门篇]?相关推荐

  1. python爬虫入门篇(二)

    往期文章 python爬虫入门篇(一) 目录 往期文章 前言 一.为什么不能直接打开开发者工具 ① 误判开发者工具中的Elements(元素)就是源代码 ② 为什么源代码和Elements显示的不一样 ...

  2. Python 爬虫进阶篇-4行代码实现爬取指定网站中的全部图片实例演示及原理剖析

    上一篇:Python 爬虫入门篇-如何获取网页中的图片.我们了解到了 urllib 获取图片的原理,urllib.request.urlretrieve() 就是用来获取图片的. 这一篇,我们用正则表 ...

  3. Python爬虫入门学习例子之煎蛋网(福利哦)

    初学Python爬虫,学习资料是这篇博客:Python爬虫入门教程 经过前边两个例子(糗事百科爬虫和百度贴吧爬虫)的学习,我自己写了一个练习的例子:爬煎蛋网的妹子图,福利哦(*^__^*) #煎蛋网爬 ...

  4. 如何自学python爬虫-怎样入门学习Python爬虫?

    怎样入门学习Python爬虫? 1.掌握Python编程能基础 想要学习爬虫,首先要充分掌握Python编程技术相关的基础知识.爬虫其实就是遵循一定的规则获取数据的过程,所以在学习Python知识的过 ...

  5. Python爬虫入门学习实战项目(一)

    静态数据的采集 第一个项目我们来抓取拉勾网的招聘信息,话不多说直接开始吧! 1.首先我们导入相关库: import requests from lxml import etree import pan ...

  6. 慕课网python零基础入门教程_零基础Python爬虫入门学习一之综述

    原标题:零基础Python爬虫入门学习一之综述 大家好哈,最近博主在学习Python,学习期间也遇到一些问题,获得了一些经验,在此将自己的学习系统地整理下来,如果大家有兴趣学习爬虫的话,可以将这些文章 ...

  7. 学习 Python 爬虫,手把手通过 Python 入门爬取网页信息

    Python 爬虫是什么? 我们在网络上收集资料的过程其实就称之为爬虫(web scraping).复制粘贴歌词.摘抄文本或数据都可以算作爬虫的一部分,但网络编程背景下的爬虫,更强调自动化,通过 Py ...

  8. python爬虫入门教程--优雅的HTTP库requests(二)

    requests 实现了 HTTP 协议中绝大部分功能,它提供的功能包括 Keep-Alive.连接池.Cookie持久化.内容自动解压.HTTP代理.SSL认证等很多特性,下面这篇文章主要给大家介绍 ...

  9. python爬虫入门教程--快速理解HTTP协议(一)

    http协议是互联网里面最重要,最基础的协议之一,我们的爬虫需要经常和http协议打交道.下面这篇文章主要给大家介绍了关于python爬虫入门之快速理解HTTP协议的相关资料,文中介绍的非常详细,需要 ...

最新文章

  1. 写给互联网产品人的进阶感言
  2. requsets模块和beautifulsoup模块
  3. 【numpy】生成一串0/1(True/False)mask序列
  4. python内置函数map_Python内置函数(34)——map
  5. 我们就来看看网络算命究竟有哪些套路
  6. Endless Spin
  7. android studio左边选择渠道,AndroidStudio简单使用(二):左侧Structure
  8. labview曲线上两点画延长线_自由泳,那些防不胜防的错误动作(上)
  9. 阿里云因 bug 禁用内部 IP 导致链路不通,造成大规模故障
  10. IIS8,OUTLOOK OWA 2013鉴赏
  11. 末转变者登录服务器一直在排队,魔兽世界:国服神级服务器,排队持续两年,哈霍兰有何特别之处?...
  12. 学习笔记-部署和管理DPM 2016-04文件和应用程序保护
  13. 程序员七夕表白攻略:原来数学才是世界上最浪漫的学科!
  14. 仿网易云音乐 web 版 vue-163-music
  15. Java毕业设计之ssm流浪猫狗|流浪狗宠物救助网站
  16. python爬虫利器之scrapy的基本教程
  17. 常见的几个凸函数与凹函数
  18. AcWing_4262
  19. Ten tools for sharepoint development
  20. 生信分析流程框架概述

热门文章

  1. mysql的覆盖语句_求教一个mysql查询问题:为什么我的SQL语句不能覆盖所有情况?内详...
  2. 自相关-能量密度谱,互相关-互能量密度谱,系统识别
  3. MUI 结合 HTML5+ 实现的二维码扫描功能
  4. 服务器系统重装后anaconda3安装以及环境配置
  5. C++调用mysql自定义函数
  6. c语言课程设计 矩阵乘法,C语言课程设计(论文)-矩阵乘法.doc
  7. 计算机里没有四款小游戏,电脑里自带游戏没有怎么办 这个方法快速找回
  8. Hyper-V 2016 系列教程52 常见的虚拟机文件格式介绍
  9. iOS开发-实现TabBar中间凸起按钮、不规则按钮(自定义TabBar)
  10. [蓝桥杯单片机]学习笔记——PWM脉宽调制信号的发生与控制