Python40行代码爬取电影天堂的电影下载连接
Python40行代码爬取电影天堂的电影下载连接
比较基础的爬虫
import re
import requests
import csvo1 = re.compile(r'2021新片精品.*?<ul>(?P<ul>.*?)</ul>', re.S)
o2 = re.compile(r"href='(?P<href>.*?)' title", re.S)
o3 = re.compile(r'◎片 名 (?P<name>.*?)<br />.*? <td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="'r'(?P<downurl>.*?)">magnet:?', re.S)url = 'https://dytt89.com/'r = requests.get(url, verify=False)
r.encoding = r.apparent_encodingc = r.text# print(c)
i1 = o1.finditer(c)lst = []
for i in i1:c1 = i.group('ul')# print(c1)i2 = o2.finditer(c1)for j in i2:lst.append(j.group('href'))# print(lst)
f = open("data1.csv", mode="w", encoding="utf-8", newline='')
cw = csv.writer(f)
cnt = 0
for i in lst:sub_url = url + i.strip('/')sub_r = requests.get(sub_url, verify=False)sub_r.encoding = sub_r.apparent_encodingsub_c = sub_r.texti3 = o3.search(sub_c)dic = i3.groupdict()cw.writerow(dic.values())cnt += 1if cnt >= 10:breakf.close()
r.close()
data1.csv
Mortal Kombat,magnet:?xt=urn:btih:f9f2f48e0e90b5567d2a7c077a10d4ddc8518706&dn=[电影天堂www.dytt89.com]真人快打-2021_HD中英双字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
The Courier,magnet:?xt=urn:btih:31d68ead23d6620a0240b8e5a3d2ea09adc9045b&dn=[电影天堂www.dytt89.com]信使-2020_BD中英双字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
서복,magnet:?xt=urn:btih:d5c8f3745d2274d3b874bfec3ad177c77d1348d3&dn=[电影天堂www.dytt89.com]徐福-2021_BD韩语中字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
Nobody,magnet:?xt=urn:btih:ef6006794b90b446ce8a55957b2aa26c76388642&dn=[电影天堂www.dytt89.com]小人物-2021_BD中英双字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
��魂,magnet:?xt=urn:btih:9d3ae0c83e58a260e45fb525f9341da00848c11d&dn=[电影天堂www.dytt89.com]缉魂-2021_HD国语中字无删减版.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
人潮汹涌,magnet:?xt=urn:btih:6835a47849c56cf9a431c1cbb903eece18735f33&dn=[电影天堂www.dytt89.com]人潮汹涌-2021_HD国语中字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
刺杀小说家,magnet:?xt=urn:btih:f269992eb6cf6ad253c75a42739f44d1b02432b4&dn=[电影天堂www.dytt89.com]刺杀小说家-2021_HD国语中字V2.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
浅田家!,magnet:?xt=urn:btih:d2cbcd17feeb04d4f5834e211f5f65c4816f28ce&dn=[电影天堂www.dytt89.com]浅田家!-2020_BD日语中字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
Raya and The Last Dragon,magnet:?xt=urn:btih:d836e530d856d41bc4410634bcde289a265ccbf2&dn=[电影天堂www.dytt89.com]寻龙传说-2021_BD中英双字V2.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
新神榜:哪吒重生,magnet:?xt=urn:btih:89847e3934f8a5ccdff2cd0e74bb1c6d17a24641&dn=[电影天堂www.dytt89.com]新神榜:哪吒重生-2021_HD国粤双语中字.mkv&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
Python40行代码爬取电影天堂的电影下载连接相关推荐
- pyquery获取不到网页完整源代码_爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网...
爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网 前言 上篇文章 PyQuery (一) 回顾.今天来介绍具体 PyQuery 的使用方法. 穷游网目标与分析 开始之前,按照之前的套路一步 ...
- Python爬虫利用18行代码爬取虎牙上百张小姐姐图片
Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...
- python爬上市公司信息_实战项目 1:5 行代码爬取国内所有上市公司信息
实战项目 1:5 行代码爬取国内所有上市公司信息 Python入门爬虫与数据分析 在正式开始这门专栏课的学习之前,我们先来看一个简单的爬虫案例.兴趣是最好的老师,当你对爬虫产生兴趣的时候,才会更有动力 ...
- 简单20行代码爬取王者荣耀官网1080p壁纸
简单20行代码爬取王者荣耀官网1080p壁纸 # -*- coding: utf-8 -*- # @Time : 2020/12/13 18:08 # @Author : ningfangcong i ...
- Python25行代码爬取豆瓣排行榜数据
Python25行代码爬取豆瓣排行榜数据 只需要用到requests, re ,csv 三个库即可. code import re import requests import csv url = ' ...
- python:利用20行代码爬取网络小说
文章目录 前言 一.爬虫是什么? 二.实现过程 总结 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 今天,来给大家一个分享一下如何使用20爬虫行代码爬取网络小说(这里我们以龙 ...
- python59行代码爬取免费ppt模板
Python59行代码爬取某站中秋节ppt模板 网址:https://www.1ppt.com/moban/zhongqiujie/ 用到的库:requests.re.os.lxml 请求方式:GET ...
- 教你用python实现34行代码爬取东方财富网信息,爬虫之路,永无止境!!
教你用python实现34行代码爬取东方财富网信息,爬虫之路,永无止境!! 代码展示: 开发环境: windows10 python3.6 开发工具: pycharm weddriver 库: sel ...
- python pyquery不规则数据的抓取_爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网...
爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网 前言 上篇文章 PyQuery (一) 回顾.今天来介绍具体 PyQuery 的使用方法. 穷游网目标与分析 开始之前,按照之前的套路一步 ...
- 120行代码爬取豆瓣电影top250
笔者最近学习爬虫,拿豆瓣电影进行练手,无奈豆瓣电影存在反爬机制,爬完250就会重定向要求我进行登陆操作,所以我这一次只爬取前50进行相关测试,废话不多说,我们来看下源代码 这次用到的还是request ...
最新文章
- 自制操作系统Antz day08——实现内核 (中) 扩展内核
- python中str和input_对python中raw_input()和input()的用法详解
- Eclipse将引用了第三方jar包的Java项目打包成jar文件
- java原始类型和引用类型_Java中的8种原始类型
- Activity嵌套fragment大全,activity加载单个fragment,TabLayout+ViewPager实现多个fragment滑动效果
- net 自定义表单的设计
- 如何给数组用fill函数和memset函数给数组赋初值
- Word 2003特殊符号录入与编辑(转)
- jvm中的新生代Eden和survivor区
- navicat for mysql 亲测好用的 中文破解版
- 全国计算机三级网络技术题库南开,计算机三级上机-适用于三级网络技术数据库等(南开100题).doc...
- Python提取PDF简历中的信息,写入Excel
- windows7 下安装 kali Linux 双系统
- ERP与MES集成技术在服装行业中的应用
- matlab传函零极点形式,计算机建模与仿真
- Vivado时序约束之—— set_max_delay、set_min_dealy(最大最小延迟约束)
- android手机变微软手机号码,微软Your Phone未来将能让你用电脑远程控制拨打Android手机电话...
- SONM DWH组件介绍
- TWEN-ASR ONE 语音识别系列教程(1)--- 运行第一个程序
- js逆向--有道翻译