【一、项目背景】

[蜜柑计划 - Mikan Project] :新一代的动漫下载站。是一个专门为喜欢动漫的小伙伴们打造的动漫视频在线播放网站,为大家第一时间分享最新动漫资源,每日精选最优质的动漫推荐。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

【二、项目目标】

实现获取动漫种子链接,并下载保存在文档。

【三、涉及的库和网站】

1、网址如下:

https://mikanani.me/Home/Classic/{}

2、涉及的库:**reques****ts、****lxml、**fake_useragent

3、软件 :PyCharm

【四、项目分析】

首先需要解决如何对下一页的网址进行请求的问题。可以点击下一页的按钮,观察到网站的变化分别如下所示:

https://mikanani.me/Home/Classic/1https://mikanani.me/Home/Classic/2https://mikanani.me/Home/Classic/3

点击下一页时,每增加一页Classic/()自增加1,用{}代替变换的变量,再用for循环遍历这网址,实现多个网址请求。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

【五、反爬措施】

1、获取正常的 http请求头,并在requests请求时设置这些常规的http请求头。

2、使用 fake_useragent ,产生随机的UserAgent进行访问。

【六、项目实施】

1、我们定义一个class类继承object,然后定义init方法继承self,再定义一个主函数main继承self。导入需要的库和网址。

import requestsfrom lxml import etreefrom fake_useragent
import UserAgentclass  Mikan(object):
def __init__(self):
self.url = "https://mikanani.me/Home/Classic/{}"
def main(self):
passif __name__ == '__main__':
Siper = Mikan()    Siper.main()

2、主方法(main):for循环实现多个网页请求。

stat = int(input("start :"))end = int(input(" end:"))for
page in range(stat, end + 1):
url = self.url.format(page)
print(url)

3、 随机产生UserAgent。

for i in range(1, 50):
self.headers = {
'User-Agent': ua.random,
}

4、发送请求 获取响应, 页面回调,方便下次请求。

def get_page(self, url):
res = requests.get(url=url, headers=self.headers)
html = res.content.decode("utf-8")
return html

5、xpath解析一级页面数据,for循环遍历补全网址,获取二级页面网址。

parse_html = etree.HTML(html)one = parse_html.xpath
('//tbody//tr//td[3]/a/@href')for li in one:    yr = "https://mikanani.me" + li

6、二级页面请求 ,先找到页面父节点,for循环遍历,再用path获取到种子的下载地址。补全种子链接地址。

tow = parse_html2.xpath('//body')for i in tow:
four = i.xpath('.//p[@class="episode-title"]//text()')[0].strip()
fif = i.xpath('.//div[@class="leftbar-nav"]/a[1]/@href')[0].strip()
# print(four)
t = "https://mikanani.me" + fif
print(t)

7、保存在word文档 。

 dirname = "./种子/" + four[:15] + four[-20:] + '.torrent'  # print(dirname)  html3 = requests.get(url=t, headers=self.headers).content  with open(dirname, 'wb') as f:      f.write(html3)      print("\n%s下载成功" % four)

8、调用方法,实现功能。

 html = self.get_page(url) self.parse_page(html)

【七、效果展示】

1、运行程序,在控制台输入起始页,终止页,如下图所示。

2、将下载成功的图片信息显示在控制台,如下图所示。

3、保存.torrent文档。

4、如何打开种子文件?先上传到百度云盘,如下图所示。

5、双击解析下载,如下图所示。

【八、总结】

1、不建议抓取太多数据,容易对服务器造成负载,浅尝辄止即可。

2、本文章就python爬取Mikan Project,在下载种子的难点和重点,以及如何防止反爬,做出了相对于的解决方案。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

3、介绍了如何去拼接字符串,以及列表如何进行类型的转换。

4、欢迎大家积极尝试,有时候看到别人实现起来很简单,但是到自己动手实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。

5、Mikan Project还提供了星期的专栏。每一天都可以看到好看的动漫。专门为喜欢动漫的小伙伴们打造的动漫视频。

6、需要本文源码的小伙伴,后台回复“动漫资源”四个字,即可获取。

看完本文有收获?请转发分享给更多的人

一篇文章教会你利用Python网络爬虫获取Mikan动漫资源相关推荐

  1. python网络爬虫_一篇文章教会你利用Python网络爬虫获取穷游攻略

    点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 穷游网提供原创实用的出境游旅行指南.攻略,旅行社区和问答交流平台, ...

  2. 一篇文章教会你利用Python网络爬虫获取素材图片

    点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 在素材网想找到合适图片需要一页一页往下翻,现在学会python就可 ...

  3. 一篇文章教会你利用Python网络爬虫获取分类图片

    点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 博海拾贝是一支互联网从业者在线教育的团队,扎根于中国教育行业以及互 ...

  4. 一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接

    [一.项目背景] 相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的下载,而且不能直观的知道最近电影更新的状态. 今天小编以电影天堂为例,带大家更直观的去看自己喜欢的电影,并且下载下来 ...

  5. python3爬虫有道翻译_一篇文章教会你利用Python网络爬虫获取有道翻译手机版的翻译接口...

    [一.项目背景] 有道翻译作为国内最大的翻译软件之一,用户量巨大.在学习时遇到不会的英语词汇,会第一时间找翻译,有道翻译就是首选.今天教大家如何去获取有道翻译手机版的翻译接口. ![image](ht ...

  6. 如何用python搜索要用的素材_一篇文章教会你利用Python网络爬虫获取素材图片

    [一.项目背景] 在素材网想找到合适图片需要一页一页往下翻,现在学会python就可以用程序把所有图片保存下来,慢慢挑选合适的图片. [二.项目目标] 1.根据给定的网址获取网页源代码. 2.利用正则 ...

  7. 一篇文章教会你利用Python网络爬虫获取穷游攻略

    [一.项目背景] 穷游网提供原创实用的出境游旅行指南.攻略,旅行社区和问答交流平台,以及智能的旅行规划解决方案,同时提供签证.保险.机票.酒店预订.租车等在线增值服务.穷游"鼓励和帮助中国旅 ...

  8. python爬取素材图片代码_一篇文章教会你利用Python网络爬虫获取素材图片

    [一.项目背景] 在素材网想找到合适图片需要一页一页往下翻,现在学会python就可以用程序把所有图片保存下来,慢慢挑选合适的图片. [二.项目目标] 1.根据给定的网址获取网页源代码. 2.利用正则 ...

  9. python下载电影天堂视频_一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接...

    点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的 ...

最新文章

  1. 独家 | 国内AI专业高考报考指南
  2. 临时配置网络(ip,网关,dns)+永久配置
  3. spring 监听器 IntrospectorCleanupListener简介
  4. intellij 常用设置
  5. 在vue中没有数据的渲染方法
  6. .NET Core ResponseCache【缓存篇(一)】
  7. dict keys 取最后一个_一步一步学Python3(小学生也适用) 第十三篇: 字典Dict类型
  8. 算法题3 二分查找法
  9. RHEL6 安装ipvsadm-1.26
  10. java编译命令是什么_java编译命令,java的编译命令是什么?
  11. javaweb开发后端常用技术_java后端开发需要掌握什么技术
  12. HTML实现简单水平导航栏
  13. 六轴机器人轨迹规划之五段位置s曲线插补
  14. sql2000 指定的服务器不存在,SQL Server 2000服务无法启动,提示“系统找不到指定的文件”解决方法及sp4安装不上...
  15. 关于自行修改人人商城模板文件目录指引
  16. SLAM论文粗译:3D Mapping with an RGB-D Camera
  17. 【单词】计算机常用1700单词
  18. linux下限制每个IP网速
  19. 使用matlab处理.nii图像
  20. 企业进军海外市场:为什么选IBM SoftLayer就对了?

热门文章

  1. 基于强化学习的自动化剪枝模型
  2. 聊一聊2020年实例分割领域的进展和未来展望
  3. 计算机界最大“追书坑”,82岁大神高德纳仍在写《计算机程序设计艺术》4B卷...
  4. 看完发现RNN原来是这样,机器学习人门贴送上
  5. 10个省时间的 PyCharm 技巧
  6. 精心总结 Python『八宗罪』,邀你来吐槽
  7. 用Python分析淘宝2000款避孕套,得出这些有趣的结论
  8. 【每日一算法】最大子序列和
  9. 【每日一算法】重排链表
  10. 如何在centos7下tomcat中安装https