引言:

最近闲来无事所以想着学习下python3,看了好长时间的文档,于是用python3写了一个漫画抓取的程序,好了 废话不多说上码!

第一步:

准备环境 和类库,我用的是python3.5      禁用 python2.x ! 禁用 python2.x !  禁用 python2.x !

用到的类库:requests  lxml  bs4  fake_useragent     pymysql

这里你 pip  安装也好或者用pycharm

pycharm 引包位置

第二步:找漫画网站

先说好本教程仅供学习交流禁止用于商务用途和其他用途

我选了一家相对还不错的漫画网站,各位小伙伴没事可以去看看

传送门: https://www.mkzhan.com

第三步: 开始编程了 准备好小伙伴

好了先导包

然后那编辑几个需要用到的方法

先做一个请求网页的方法

在这里headers 需要配置一个user-agent,否则很容易就会被对方服务器发现你是爬虫那

然后创建一个图片检测方法,毕竟图片损坏了你下载下来也没用

先抓详情 来分析下页面结构

嗯 这是我找出一些有用的信息 ,不过今天我们只用到标题 封面 和章节,然后哪章节列表举栗子,先上码

分析下li 特性 class 里都有一个参数 j-chapter-item 那好 find_all 把符合规则的拿出来

然后根据标题创建文件夹,同时根据封面的页面规则 抓到封面的img 放到之前写好的 get_img 方法里检测下,然后open 下载下来

刚刚抓好的章节列表遍历下,毕竟我们要把每章节的每张有用图片下载下来

新建一个章节的抓取方法

这里要把章节里的图片抓取出来

按照上面分析下html结构,根据规则做相应的抓取 并将图片下载到相应的位置

结果:

好了大功告成,代码虽然很比较low 但毕竟一个初级学员 大神勿喷

相对于想开始尝试做一下python抓取的同学很合适哦

不多说上源码 github:传送门

python3抓取图片_通过Python3 爬虫抓取漫画图片相关推荐

  1. 获取http地址如何从上面抓取图片_用 Python 自动抓取妹子图

    目录 前言 Media Pipeline 启用Media Pipeline 使用 ImgPipeline 抓取妹子图 瞎比比与送书后话 前言 我们在抓取数据的过程中,除了要抓取文本数据之外,当然也会有 ...

  2. java抓取图片_Java实现的爬虫抓取图片并保存操作示例

    本文实例讲述了Java实现的爬虫抓取图片并保存操作.分享给大家供大家参考,具体如下: 这是我参考了网上一些资料写的第一个java爬虫程序 本来是想获取煎蛋网无聊图的图片,但是网络返回码一直是503,所 ...

  3. java 爬取图片_使用Java多线程爬取网站图片

    使用Java爬取网站的图片并保存至本地 使用maven导入依赖org.jsoup jsoup 1.11.2 实现代码:import org.jsoup.HttpStatusException; imp ...

  4. 通过Python3 爬虫抓取漫画图片

    通过Python3 爬虫抓取漫画图片 引言: 最近闲来无事所以想着学习下python3,看了好长时间的文档,于是用python3写了一个漫画抓取的程序,好了 废话不多说上码! 第一步: 准备环境 和类 ...

  5. python爬虫,爬取下载图片

    python爬虫,爬取下载图片 分别引入以下三个包 from urllib.request import urlopen from bs4 import BeautifulSoup import re ...

  6. node:爬虫爬取网页图片 1

    代码地址如下: http://www.demodashi.com/demo/13845.html 前言 周末自己在家闲着没事,刷着微信,玩着手机,发现自己的微信头像该换了,就去网上找了一下头像,看着图 ...

  7. 小爬虫爬取小猫咪图片并存入本地文件夹

    小爬虫爬取小猫咪图片并存入本地文件夹 本人是安徽工业大学电气与信息工程学院研一学生,最近还不能开学真的是很糟心哦,由于自己比较笨吧,起步较晚还要忙着学习机器学习还有计算机视觉,但是总学这个感觉很闷也没 ...

  8. python3 爬虫技巧_用 python 爬虫抓站的一些技巧总结

    学用python也有3个多月了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写goog ...

  9. python爬虫爬取网页图片_Python爬虫实现抓取网页图片

    在逛贴吧的时候看见贴吧里面漂亮的图片,或有漂亮妹纸的图片,是不是想保存下来? 但是有的网页的图片比较多,一个个保存下来比较麻烦. 最近在学Python,所以用Python来抓取网页内容还是比较方便的: ...

最新文章

  1. 64 DLL动态链接库换一台电脑就不能加载
  2. ORACLE sqlplus set 命令速查
  3. 网页客户端调用gSoap发布服务,以及中文乱码问题
  4. getdate 日期间隔_日期getDate()方法以及JavaScript中的示例
  5. oracle创建表空间和用户授权
  6. 刷网络课_网络营销实践心得—刘荟萌
  7. 如何用 javascript 做一个高逼格的进度条
  8. 【ES6】什么是Promise?解析Promise的基本用法
  9. html经过菜单变色移开恢复,h5学习笔记:transition菜单过渡变色
  10. 特征向量的线性无关性
  11. _stdcall与_cdecl区别
  12. 940mx黑苹果驱动_【必看】黑苹果安装显卡支持列表
  13. 如何利用MATLAB做非线性一元回归,Matlab一元非线性回归分析
  14. Harvard (name and date) 论文引用格式
  15. 我知道很多主播因为以前因为公会的名声不太好,或者不想签约被束缚等原因
  16. Postgresql语句持续更新
  17. left join和left semi join的区别
  18. vba返回excel中所有菜单命令栏CommandBar的名称
  19. win7 文件夹工具栏
  20. 安全计算:AntiVir Personal Edition提供免费病毒防护

热门文章

  1. Docker最全教程之使用Tencent Hub来完成CI(十)
  2. .NET Core使用NLog通过Kafka实现日志收集
  3. 开源纯C#工控网关+组态软件(四)上下位机通讯原理
  4. 心电图计算心率公式_心电图到底能反应啥问题,看过之后你也能当“医生”
  5. 小组是什么意思_生猪期货什么时候上市?相关企业如何参与生猪期货
  6. C# 的扩展方法在 LINQ 中实现数组排序
  7. 遥感RS植被指数大全整理
  8. Android之ndk之用arm-linux-androideabi工具通过地址找到具体哪里崩溃
  9. 汇编语言之数据处理的2个基本问题
  10. Andorid之taskAffinity 和 FLAG_ACTIVITY_NEW_TASK