Python简单爬取电影磁力链接

网页的链接：http://www.ygdy8.net/html/gndy/dyzz/list_23_2.html
打开你想要的电影：http://www.ygdy8.net/html/gndy/dyzz/20181124/57807.html
找到下载地址：

代码：
import requests#网络请求模块
import re #提取数据
for n in range(1, 187):
# 网址
a_url = ‘http://www.ygdy8.net/html/gndy/dyzz/list_23_’ + str(n) + ‘.html’
#打印检查页面链接
print(a_url)
打印出的网页链接：

一共186页

for n in range(1, 2):# 网址a_url = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_' + str(n) + '.html'#print(a_url)html_1 = requests.get(a_url)html_1.encoding='gb2312'print(html_1.status_code) #200re.findall #列表detil_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)print(detil_list)#返回列表[]

以列表形式返回提取的每个电影链接：（还不是完整的链接）

#拼接网址：

    for m in detil_list:b_url = 'http://www.ygdy8.net'+mhtml_2 = requests.get(b_url)html_2.encoding = 'gb2312'  # 网站格式‘gb2312’，防乱码#print(b_url)

提取完整下载链接代码：

ftp=re.findall('<a href="(.*?)">.*?</a></td>',html_2.text)print(ftp)#打印列表html_2

打印到txt文本代码：

        with open('C:\\Users\\张云强\\Desktop\\test\\dytt.txt','a',encoding='utf-8')as f:#写入本地 write写文本f.write(ftp[0]+'\n')

把txt文本的链接复制到迅雷下载即可。

最终代码：

import  requests#网络请求
import re#提取数据def xb(pages):for n in range (1,pages):#网址a_url = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_'+str(n)+'.html'#print(a_url)html_1=requests.get(a_url)html_1.encoding = 'gb2312'# print(html_1.status_code) #200#print(html_1.text)  #查看网页源代码# re.findall 列表detil_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)# print(detil_list)for m in detil_list:#for m in detil_list[0]:提取一个b_url ='http://www.ygdy8.net/'+ m#print(b_url)html_2=requests.get(b_url)#指定网页编码格式html_2.encoding = 'gb2312'#print(html_2.text)#re.findall()返回列表ftp = re.findall('<a href="(.*?)">.*?</a></td>',html_2.text)#print(ftp)打印查看with open('C:\\Users\\张云强\\Desktop\\test\\dytt.txt','a',encoding='utf-8')as f:#写入本地 write写文本f.write(ftp[0]+'\n')xb(20)

Python简单爬取电影磁力链接相关推荐

python实战-HTML形式爬虫-批量爬取电影下载链接
文章目录一.前言二.思路 1.网站返回内容 2.url分页结构 3.子页面访问形式 4.多种下载链接判断三.具体代码的实现四.总结一.前言喜欢看片的小伙伴,肯定想打造属于自己的私人影院 ...
项目三：爬取视频磁力链接
项目三:爬取视频磁力链接标签(空格分隔): 爬虫 BeautifulSoup -具体技术实现原理类似项目二 1. 项目任务分析类似上一个小项目中爬取图片的技术原理,本次小项目尝试对相同网站上的可供 ...
Python，爬取电影天堂，你觉得怎么样？
一.爬虫的重要性: 如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛.网络蜘蛛通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它 ...
Python小工具-电影天堂爬取电影下载链接
import requests import bs4# 获取单独的url def movie_info(url):'''内容标签:<div id="Zoom">下载链接 ...
Python|简单爬取豆瓣网电影信息
欢迎点击「算法与编程之美」↑关注我们! 本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 欢迎加入团队圈子!与作者面对面!直接点击! 前言: 在掌握一些 ...
python 爬取电影下载链接
#!/usr/bin/python #coding=UTF-8 import sys import urllib2 import os import chardet from bs4 import B ...
python编程100例头条-python 简单爬取今日头条热点新闻(一)
今日头条如今在自媒体领域算是比较强大的存在,今天就带大家利用python爬去今日头条的热点新闻,理论上是可以做到无限爬取的: 在浏览器中打开今日头条的链接,选中左侧的热点,在浏览器开发者模式netwo ...
Python简单爬取起点中文网小说（仅学习）
目录前言一.爬虫思路二.使用步骤 1.引入库 2.读取页面 3.分析HTML 3.从标签中取出信息 4.爬取正文总结前言实习期间自学了vba,现在开始捡回以前上课学过的python,在此记 ...
python怎么爬取电影海报_Python 爬取猫眼数据分析《无名之辈》为何能逆袭成黑马？...
原标题:Python 爬取猫眼数据分析<无名之辈>为何能逆袭成黑马? 作者 | 罗昭成责编 | 唐小引出品 | CSDN(ID:CSDNNews) 最近几天,有部国产电影因好评及口碑传 ...

Python简单爬取电影磁力链接

Python简单爬取电影磁力链接相关推荐

最新文章

热门文章