Python简单爬取电影磁力链接
Python简单爬取电影磁力链接
网页的链接:http://www.ygdy8.net/html/gndy/dyzz/list_23_2.html
打开你想要的电影:http://www.ygdy8.net/html/gndy/dyzz/20181124/57807.html
找到下载地址:
代码:
import requests#网络请求模块
import re #提取数据
for n in range(1, 187):
# 网址
a_url = ‘http://www.ygdy8.net/html/gndy/dyzz/list_23_’ + str(n) + ‘.html’
#打印检查页面链接
print(a_url)
打印出的网页链接:
一共186页
for n in range(1, 2):# 网址a_url = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_' + str(n) + '.html'#print(a_url)html_1 = requests.get(a_url)html_1.encoding='gb2312'print(html_1.status_code) #200re.findall #列表detil_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)print(detil_list)#返回列表[]
以列表形式返回提取的每个电影链接:(还不是完整的链接)
#拼接网址:
for m in detil_list:b_url = 'http://www.ygdy8.net'+mhtml_2 = requests.get(b_url)html_2.encoding = 'gb2312' # 网站格式‘gb2312’,防乱码#print(b_url)
提取完整下载链接代码:
ftp=re.findall('<a href="(.*?)">.*?</a></td>',html_2.text)print(ftp)#打印列表html_2
打印到txt文本代码:
with open('C:\\Users\\张云强\\Desktop\\test\\dytt.txt','a',encoding='utf-8')as f:#写入本地 write写文本f.write(ftp[0]+'\n')
把txt文本的链接复制到迅雷下载即可。
最终代码:
import requests#网络请求
import re#提取数据def xb(pages):for n in range (1,pages):#网址a_url = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_'+str(n)+'.html'#print(a_url)html_1=requests.get(a_url)html_1.encoding = 'gb2312'# print(html_1.status_code) #200#print(html_1.text) #查看网页源代码# re.findall 列表detil_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)# print(detil_list)for m in detil_list:#for m in detil_list[0]:提取一个b_url ='http://www.ygdy8.net/'+ m#print(b_url)html_2=requests.get(b_url)#指定网页编码格式html_2.encoding = 'gb2312'#print(html_2.text)#re.findall()返回列表ftp = re.findall('<a href="(.*?)">.*?</a></td>',html_2.text)#print(ftp)打印查看with open('C:\\Users\\张云强\\Desktop\\test\\dytt.txt','a',encoding='utf-8')as f:#写入本地 write写文本f.write(ftp[0]+'\n')xb(20)
Python简单爬取电影磁力链接相关推荐
- python实战-HTML形式爬虫-批量爬取电影下载链接
文章目录 一.前言 二.思路 1.网站返回内容 2.url分页结构 3.子页面访问形式 4.多种下载链接判断 三.具体代码的实现 四.总结 一.前言 喜欢看片的小伙伴,肯定想打造属于自己的私人影院 ...
- 项目三:爬取视频磁力链接
项目三:爬取视频磁力链接 标签(空格分隔): 爬虫 BeautifulSoup -具体技术实现原理类似项目二 1. 项目任务分析 类似上一个小项目中爬取图片的技术原理,本次小项目尝试对相同网站上的可供 ...
- Python,爬取电影天堂,你觉得怎么样?
一.爬虫的重要性: 如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛.网络蜘蛛通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它 ...
- Python小工具-电影天堂爬取电影下载链接
import requests import bs4# 获取单独的url def movie_info(url):'''内容标签:<div id="Zoom">下载链接 ...
- Python|简单爬取豆瓣网电影信息
欢迎点击「算法与编程之美」↑关注我们! 本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 欢迎加入团队圈子!与作者面对面!直接点击! 前言: 在掌握一些 ...
- python 爬取电影下载链接
#!/usr/bin/python #coding=UTF-8 import sys import urllib2 import os import chardet from bs4 import B ...
- python编程100例头条-python 简单爬取今日头条热点新闻(一)
今日头条如今在自媒体领域算是比较强大的存在,今天就带大家利用python爬去今日头条的热点新闻,理论上是可以做到无限爬取的: 在浏览器中打开今日头条的链接,选中左侧的热点,在浏览器开发者模式netwo ...
- Python简单爬取起点中文网小说(仅学习)
目录 前言 一.爬虫思路 二.使用步骤 1.引入库 2.读取页面 3.分析HTML 3.从标签中取出信息 4.爬取正文 总结 前言 实习期间自学了vba,现在开始捡回以前上课学过的python,在此记 ...
- python怎么爬取电影海报_Python 爬取猫眼数据分析《无名之辈》为何能逆袭成黑马?...
原标题:Python 爬取猫眼数据分析<无名之辈>为何能逆袭成黑马? 作者 | 罗昭成 责编 | 唐小引 出品 | CSDN(ID:CSDNNews) 最近几天,有部国产电影因好评及口碑传 ...
最新文章
- ubuntu 12 JDK 编译
- 2021fall Bloomberg校招
- iOS----------学习路线思维导图
- mysql 存储过程项目小结
- TextKit简单示例
- 数据结构与算法之Manacher算法
- 【设计模式之美】<Reading Notes>继承与组合
- Java学习笔记4——I/O框架
- spring4.x(13)---SpringEL-操作List、Map
- 无setup.exe情况下安装mysql5.7.28(win10)
- DOS 下编写带有日期的脚本例子
- sql语言的一大类 DML 数据的操纵语言
- 菲克扩散(第一)定律【Fick's (First) Law of Binary Diffussion】
- JS控制DIV的显示隐藏 。js中radio的取值 。JS控制select的方法(摘取)。js 控制表单中SELECT
- L2-004 这是二叉搜索树吗? (25分)*
- ArcGIS Pro创建企业级地理数据库(Postgis)
- Hadoop2.7.1+Hbase1.2.1集群环境搭建(5)hbase安装
- DLP和3LCD投影仪技术有什么区别?怎么选看这里!
- 从身份证号获取身份证信息
- 画一只会动的皮卡丘(下)