Python简单爬取电影磁力链接

网页的链接:http://www.ygdy8.net/html/gndy/dyzz/list_23_2.html
打开你想要的电影:http://www.ygdy8.net/html/gndy/dyzz/20181124/57807.html
找到下载地址:

代码:
import requests#网络请求模块
import re #提取数据
for n in range(1, 187):
# 网址
a_url = ‘http://www.ygdy8.net/html/gndy/dyzz/list_23_’ + str(n) + ‘.html’
#打印检查页面链接
print(a_url)
打印出的网页链接:

一共186页

for n in range(1, 2):# 网址a_url = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_' + str(n) + '.html'#print(a_url)html_1 = requests.get(a_url)html_1.encoding='gb2312'print(html_1.status_code) #200re.findall #列表detil_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)print(detil_list)#返回列表[]

以列表形式返回提取的每个电影链接:(还不是完整的链接)

#拼接网址:

    for m in detil_list:b_url = 'http://www.ygdy8.net'+mhtml_2 = requests.get(b_url)html_2.encoding = 'gb2312'  # 网站格式‘gb2312’,防乱码#print(b_url)

提取完整下载链接代码:

ftp=re.findall('<a href="(.*?)">.*?</a></td>',html_2.text)print(ftp)#打印列表html_2


打印到txt文本代码:

        with open('C:\\Users\\张云强\\Desktop\\test\\dytt.txt','a',encoding='utf-8')as f:#写入本地 write写文本f.write(ftp[0]+'\n')


把txt文本的链接复制到迅雷下载即可。

最终代码:

import  requests#网络请求
import re#提取数据def xb(pages):for n in range (1,pages):#网址a_url = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_'+str(n)+'.html'#print(a_url)html_1=requests.get(a_url)html_1.encoding = 'gb2312'# print(html_1.status_code) #200#print(html_1.text)  #查看网页源代码# re.findall 列表detil_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)# print(detil_list)for m in detil_list:#for m in detil_list[0]:提取一个b_url ='http://www.ygdy8.net/'+ m#print(b_url)html_2=requests.get(b_url)#指定网页编码格式html_2.encoding = 'gb2312'#print(html_2.text)#re.findall()返回列表ftp = re.findall('<a href="(.*?)">.*?</a></td>',html_2.text)#print(ftp)打印查看with open('C:\\Users\\张云强\\Desktop\\test\\dytt.txt','a',encoding='utf-8')as f:#写入本地 write写文本f.write(ftp[0]+'\n')xb(20)

Python简单爬取电影磁力链接相关推荐

  1. python实战-HTML形式爬虫-批量爬取电影下载链接

    文章目录 一.前言 二.思路 1.网站返回内容 2.url分页结构 3.子页面访问形式 4.多种下载链接判断 三.具体代码的实现 四.总结 一.前言   喜欢看片的小伙伴,肯定想打造属于自己的私人影院 ...

  2. 项目三:爬取视频磁力链接

    项目三:爬取视频磁力链接 标签(空格分隔): 爬虫 BeautifulSoup -具体技术实现原理类似项目二 1. 项目任务分析 类似上一个小项目中爬取图片的技术原理,本次小项目尝试对相同网站上的可供 ...

  3. Python,爬取电影天堂,你觉得怎么样?

    一.爬虫的重要性: 如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛.网络蜘蛛通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它 ...

  4. Python小工具-电影天堂爬取电影下载链接

    import requests import bs4# 获取单独的url def movie_info(url):'''内容标签:<div id="Zoom">下载链接 ...

  5. Python|简单爬取豆瓣网电影信息

    欢迎点击「算法与编程之美」↑关注我们! 本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 欢迎加入团队圈子!与作者面对面!直接点击! 前言: 在掌握一些 ...

  6. python 爬取电影下载链接

    #!/usr/bin/python #coding=UTF-8 import sys import urllib2 import os import chardet from bs4 import B ...

  7. python编程100例头条-python 简单爬取今日头条热点新闻(一)

    今日头条如今在自媒体领域算是比较强大的存在,今天就带大家利用python爬去今日头条的热点新闻,理论上是可以做到无限爬取的: 在浏览器中打开今日头条的链接,选中左侧的热点,在浏览器开发者模式netwo ...

  8. Python简单爬取起点中文网小说(仅学习)

    目录 前言 一.爬虫思路 二.使用步骤 1.引入库 2.读取页面 3.分析HTML 3.从标签中取出信息 4.爬取正文 总结 前言 实习期间自学了vba,现在开始捡回以前上课学过的python,在此记 ...

  9. python怎么爬取电影海报_Python 爬取猫眼数据分析《无名之辈》为何能逆袭成黑马?...

    原标题:Python 爬取猫眼数据分析<无名之辈>为何能逆袭成黑马? 作者 | 罗昭成 责编 | 唐小引 出品 | CSDN(ID:CSDNNews) 最近几天,有部国产电影因好评及口碑传 ...

最新文章

  1. ubuntu 12 JDK 编译
  2. 2021fall Bloomberg校招
  3. iOS----------学习路线思维导图
  4. mysql 存储过程项目小结
  5. TextKit简单示例
  6. 数据结构与算法之Manacher算法
  7. 【设计模式之美】<Reading Notes>继承与组合
  8. Java学习笔记4——I/O框架
  9. spring4.x(13)---SpringEL-操作List、Map
  10. 无setup.exe情况下安装mysql5.7.28(win10)
  11. DOS 下编写带有日期的脚本例子
  12. sql语言的一大类 DML 数据的操纵语言
  13. 菲克扩散(第一)定律【Fick's (First) Law of Binary Diffussion】
  14. JS控制DIV的显示隐藏 。js中radio的取值 。JS控制select的方法(摘取)。js 控制表单中SELECT
  15. L2-004 这是二叉搜索树吗? (25分)*
  16. ArcGIS Pro创建企业级地理数据库(Postgis)
  17. Hadoop2.7.1+Hbase1.2.1集群环境搭建(5)hbase安装
  18. DLP和3LCD投影仪技术有什么区别?怎么选看这里!
  19. 从身份证号获取身份证信息
  20. 画一只会动的皮卡丘(下)

热门文章

  1. 蓝桥杯31天冲刺之十 [java]
  2. Android项目模板化
  3. Linux操作系统七大武器详解
  4. 香港武侠电影十大金曲和影视剧的怀旧经典金曲
  5. 网络安全-网络漏洞分类
  6. Origin折线图--error面积填充
  7. 黑科技: 高性能计算BurstBuffer技术详解
  8. 在线音乐播放问题全解
  9. RBtree插入跟删除图解代码
  10. python 字符串操作和内建函数