Python40行代码爬取电影天堂的电影下载连接

比较基础的爬虫

import re
import requests
import csvo1 = re.compile(r'2021新片精品.*?<ul>(?P<ul>.*?)</ul>', re.S)
o2 = re.compile(r"href='(?P<href>.*?)' title", re.S)
o3 = re.compile(r'◎片  名 (?P<name>.*?)<br />.*? <td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="'r'(?P<downurl>.*?)">magnet:?', re.S)url = 'https://dytt89.com/'r = requests.get(url, verify=False)
r.encoding = r.apparent_encodingc = r.text# print(c)
i1 = o1.finditer(c)lst = []
for i in i1:c1 = i.group('ul')# print(c1)i2 = o2.finditer(c1)for j in i2:lst.append(j.group('href'))# print(lst)
f = open("data1.csv", mode="w", encoding="utf-8", newline='')
cw = csv.writer(f)
cnt = 0
for i in lst:sub_url = url + i.strip('/')sub_r = requests.get(sub_url, verify=False)sub_r.encoding = sub_r.apparent_encodingsub_c = sub_r.texti3 = o3.search(sub_c)dic = i3.groupdict()cw.writerow(dic.values())cnt += 1if cnt >= 10:breakf.close()
r.close()

data1.csv

Mortal Kombat,magnet:?xt=urn:btih:f9f2f48e0e90b5567d2a7c077a10d4ddc8518706&dn=[电影天堂www.dytt89.com]真人快打-2021_HD中英双字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
The Courier,magnet:?xt=urn:btih:31d68ead23d6620a0240b8e5a3d2ea09adc9045b&dn=[电影天堂www.dytt89.com]信使-2020_BD中英双字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
서복,magnet:?xt=urn:btih:d5c8f3745d2274d3b874bfec3ad177c77d1348d3&dn=[电影天堂www.dytt89.com]徐福-2021_BD韩语中字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
Nobody,magnet:?xt=urn:btih:ef6006794b90b446ce8a55957b2aa26c76388642&dn=[电影天堂www.dytt89.com]小人物-2021_BD中英双字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
��魂,magnet:?xt=urn:btih:9d3ae0c83e58a260e45fb525f9341da00848c11d&dn=[电影天堂www.dytt89.com]缉魂-2021_HD国语中字无删减版.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
人潮汹涌,magnet:?xt=urn:btih:6835a47849c56cf9a431c1cbb903eece18735f33&dn=[电影天堂www.dytt89.com]人潮汹涌-2021_HD国语中字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
刺杀小说家,magnet:?xt=urn:btih:f269992eb6cf6ad253c75a42739f44d1b02432b4&dn=[电影天堂www.dytt89.com]刺杀小说家-2021_HD国语中字V2.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
浅田家!,magnet:?xt=urn:btih:d2cbcd17feeb04d4f5834e211f5f65c4816f28ce&dn=[电影天堂www.dytt89.com]浅田家!-2020_BD日语中字.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
Raya and The Last Dragon,magnet:?xt=urn:btih:d836e530d856d41bc4410634bcde289a265ccbf2&dn=[电影天堂www.dytt89.com]寻龙传说-2021_BD中英双字V2.mp4&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce
新神榜:哪吒重生,magnet:?xt=urn:btih:89847e3934f8a5ccdff2cd0e74bb1c6d17a24641&dn=[电影天堂www.dytt89.com]新神榜:哪吒重生-2021_HD国粤双语中字.mkv&tr=http://t.t789.me:2710/announce&tr=http://t.t789.co:2710/announce&tr=http://t.t789.vip:2710/announce

Python40行代码爬取电影天堂的电影下载连接相关推荐

  1. pyquery获取不到网页完整源代码_爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网...

    爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网 前言 上篇文章 PyQuery (一) 回顾.今天来介绍具体 PyQuery 的使用方法. 穷游网目标与分析 开始之前,按照之前的套路一步 ...

  2. Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

    Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...

  3. python爬上市公司信息_实战项目 1:5 行代码爬取国内所有上市公司信息

    实战项目 1:5 行代码爬取国内所有上市公司信息 Python入门爬虫与数据分析 在正式开始这门专栏课的学习之前,我们先来看一个简单的爬虫案例.兴趣是最好的老师,当你对爬虫产生兴趣的时候,才会更有动力 ...

  4. 简单20行代码爬取王者荣耀官网1080p壁纸

    简单20行代码爬取王者荣耀官网1080p壁纸 # -*- coding: utf-8 -*- # @Time : 2020/12/13 18:08 # @Author : ningfangcong i ...

  5. Python25行代码爬取豆瓣排行榜数据

    Python25行代码爬取豆瓣排行榜数据 只需要用到requests, re ,csv 三个库即可. code import re import requests import csv url = ' ...

  6. python:利用20行代码爬取网络小说

    文章目录 前言 一.爬虫是什么? 二.实现过程 总结 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 今天,来给大家一个分享一下如何使用20爬虫行代码爬取网络小说(这里我们以龙 ...

  7. python59行代码爬取免费ppt模板

    Python59行代码爬取某站中秋节ppt模板 网址:https://www.1ppt.com/moban/zhongqiujie/ 用到的库:requests.re.os.lxml 请求方式:GET ...

  8. 教你用python实现34行代码爬取东方财富网信息,爬虫之路,永无止境!!

    教你用python实现34行代码爬取东方财富网信息,爬虫之路,永无止境!! 代码展示: 开发环境: windows10 python3.6 开发工具: pycharm weddriver 库: sel ...

  9. python pyquery不规则数据的抓取_爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网...

    爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网 前言 上篇文章 PyQuery (一) 回顾.今天来介绍具体 PyQuery 的使用方法. 穷游网目标与分析 开始之前,按照之前的套路一步 ...

  10. 120行代码爬取豆瓣电影top250

    笔者最近学习爬虫,拿豆瓣电影进行练手,无奈豆瓣电影存在反爬机制,爬完250就会重定向要求我进行登陆操作,所以我这一次只爬取前50进行相关测试,废话不多说,我们来看下源代码 这次用到的还是request ...

最新文章

  1. 自制操作系统Antz day08——实现内核 (中) 扩展内核
  2. python中str和input_对python中raw_input()和input()的用法详解
  3. Eclipse将引用了第三方jar包的Java项目打包成jar文件
  4. java原始类型和引用类型_Java中的8种原始类型
  5. Activity嵌套fragment大全,activity加载单个fragment,TabLayout+ViewPager实现多个fragment滑动效果
  6. net 自定义表单的设计
  7. 如何给数组用fill函数和memset函数给数组赋初值
  8. Word 2003特殊符号录入与编辑(转)
  9. jvm中的新生代Eden和survivor区
  10. navicat for mysql 亲测好用的 中文破解版
  11. 全国计算机三级网络技术题库南开,计算机三级上机-适用于三级网络技术数据库等(南开100题).doc...
  12. Python提取PDF简历中的信息,写入Excel
  13. windows7 下安装 kali Linux 双系统
  14. ERP与MES集成技术在服装行业中的应用
  15. matlab传函零极点形式,计算机建模与仿真
  16. Vivado时序约束之—— set_max_delay、set_min_dealy(最大最小延迟约束)
  17. android手机变微软手机号码,微软Your Phone未来将能让你用电脑远程控制拨打Android手机电话...
  18. SONM DWH组件介绍
  19. TWEN-ASR ONE 语音识别系列教程(1)--- 运行第一个程序
  20. js逆向--有道翻译

热门文章

  1. (已更新)成语小秀才小程序V2.0.14完整安装包+小程序前端
  2. spring事务出现的超卖问题
  3. 关于大地测量领域常用的角度知识汇总(方位角,竖直角)
  4. 为什么要创建SRT?
  5. 读大道至简之我见1——团队管理
  6. 《如何阅读一本书》笔记
  7. 常用计算机信息检索策略,信息检索的策略和方法
  8. spring boot网上眼镜商场毕业设计-附源码241659
  9. Riverbed连续第四年成为Gartner魔力象限领导者
  10. 第三章 Unity基础之API