一、写在前面

圣城家园(SCG)倒了BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在这些主流视频网站上面依然没有,我平时看电影又习惯下载下来再看,所以每次看电影找资源就很麻烦,花了点时间,于是就有了这个程序。

二、目的

输入一部电影的名字,帮我到BT之家上面看看有没有,如果有就把下载链接复制给我。

三、设计思路

本来想的是直接爬取首页最近发布的电影,然后取判断有没有,后来想了一下,为什么不直接使用网站的搜索功能呢?

四、开始爬虫

4.1.分析网站

打开网站搜索一个结果,发现在网址里面直接修改链接的内容就能到达搜索页面,那这样就更简单。

先让用户输入一部电影的名字,直接生成链接。

在学习过程中有什么不懂得可以加我的
python学习qun,855408893
群里有不错的学习视频教程、开发工具与电子书籍。
与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内容
# 要求输入电影名
inputname = input('\n' + '请输入您要搜索的电影:')# 链接是用网站的搜索功能
url = "http://www.6btbtt.com/search-index-keyword-" + inputname + ".htm"

接下来再看搜索结果是什么样的,使用审查元素看看,就会看到搜索结果里面电影名字和链接会在一个a标签里面,类型为subject_link thread-old read

至此网站就分析完成了

4.2.开始爬取过程

刚才已经得到了电影名和网站,那么下面直接获得搜索结果页面的内容就行,用requests获取内容,获取后顺便用beautifulsoup解析一下,解析后的东西就是有格式的,这样才能进行下一步操作。

# 获取网页内容并用beautifulsoup解析一下
soup = BeautifulSoup(requests.get(url).text,'lxml')# 给出找到第一个结果,网站搜索结果就是把最新的排在前面,所以一个结果就够了
movies = soup.find('a','subject_link thread-old')

然而现在我们是得到一段内容,它不光包含电影标题和链接,还包含其他的东西,我们要做的就是把电影标题和链接分别提取出来。

# 直接输出电影和链接
try:link = movies.get('href')name = movies.text  ####这里用的是text,因为标签下面还有标签,是string无法获取文本内容print('\n' + name)print(link + '\n')
except:print("没有找到这部电影或程序发生未知错误")

这里用try和except来捕捉程序反馈,就是说假如获取的内容有问题,那程序不崩溃,就执行其他的或者进行下一步操作

至此,我们已经得到了电影和链接了,爬虫过程也算结束了。

4.3判断爬取结果和用户输入

由于电影标题出来包含真正的电影名还包含清晰度、年代、格式等等这些信息,通常是这样的

[BT下载][小丑][BD- MKV/2.12GB][英语中英字幕][1080P][DC年度精彩大片蓝光版]

这些我们都不要,在把它分割出来,单独取出电影名字,分割方法就是前面是 “下载][” 后面是“][”,取中间文本就可以。

# 这是用于从网页的电影标题里面分割出真正的电影名
def get_str_btw(s,f,b):par = s.partition(f)return (par[2].partition(b))[0][:]try:mname = (get_str_btw(name,"下载][","]["))
except:print("无法匹配搜索结果")

单独取出电影名字后进行比对,这里只是简单地进行文字匹配,本来应该可以多爬取几个结果,然后模糊搜索进行匹配的。

在学习过程中有什么不懂得可以加我的
python学习qun,855408893
群里有不错的学习视频教程、开发工具与电子书籍。
与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内容
# 判断输入的和获取到的电影名字是否匹配
if mname == inputname:print("电影有啦!链接已复制!祝您观影愉快!" + '\n')pyperclip.copy(link)
else:print("我给您找到了这个!")

最后再加上一个让程序运行完等一下的命令

# 程序执行完不要马上关闭窗口
os.system("pause")

至此,这个程序就完成了。

运行截图

五:注意事项

5.1.导入模块的时候如果发现不能导入,可能是缺少c++运行库,去下载官方工具安装就行;

5.2网站里面看似相同的元素标签可能不同,比如那个热门电影和新电影标签不一样,一开始遍历爬取的时候发现总是报错;

5.3一定要用tryexcept来避免出现意外;

程序可能没有意义,但生命不息,折腾不止。

Python爬虫爬取BT之家找电影资源相关推荐

  1. python找电影资源_Python爬虫爬取BT之家找电影资源

    head.jpg 一.写在前面 最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越 ...

  2. python爬电影资源_Python爬虫爬取BT之家找电影资源

    一.写在前面 最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在 ...

  3. beautifulsoup爬取网页中的表格_Python爬虫爬取BT之家找电影资源

    一.写在前面 最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在 ...

  4. Python爬虫爬取链家网上的房源信息练习

    一 原链接:用Python爬虫爬取链家网上的房源信息_shayebuhui_a的博客-CSDN博客_python爬取链家 打开链家网页:https://sh.lianjia.com/zufang/  ...

  5. python爬取BT之家特定频道前5页电影信息(小白操作)

    python爬取BT之家特定频道前5页电影信息(小白操作) 想要爬的网页如下,希望得到BT之家恐怖频道的电影信息,并存档xls 代码如下 import requests,openpyxl wb=ope ...

  6. 如何用六步教会你使用python爬虫爬取数据

    前言: 用python的爬虫爬取数据真的很简单,只要掌握这六步就好,也不复杂.以前还以为爬虫很难,结果一上手,从初学到把东西爬下来,一个小时都不到就解决了. python爬出六部曲 第一步:安装req ...

  7. python爬虫代码实例-Python爬虫爬取百度搜索内容代码实例

    这篇文章主要介绍了Python爬虫爬取百度搜索内容代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 搜索引擎用的很频繁,现在利用Python爬 ...

  8. python爬虫数据分析可以做什么-python爬虫爬取的数据可以做什么

    在Python中连接到多播服务器问题,怎么解决你把redirect关闭就可以了.在send时,加上参数allow_redirects=False 通常每个浏览器都会设置redirect的次数.如果re ...

  9. python网易云_用python爬虫爬取网易云音乐

    标签: 使用python爬虫爬取网易云音乐 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页版找一下你想要听的歌曲点击进去.按键盘F12打开网页调试工具,点击Ne ...

最新文章

  1. 原创:检查点的三种加入方式
  2. 不会英语能学oracle吗,英语非常差该怎么学啊?
  3. SQL Server2012如何导出sql脚本并且还原数据库
  4. mysqldump导出数据
  5. linux系统expdp按表空间导出,expdp导出是全库吗
  6. 学生成绩管理系统(C语言版)
  7. 计算机组成原理-面试题
  8. java smtp服务器,用Java实现SMTP服务器
  9. oracle用命令导入dmp,Oracle导出导入dmp文件(exp.imp命令行)
  10. 1.44TFT彩屏字体翻转,扫描方式的改变
  11. 慕课网C#开发轻松入门 6-1练习题目
  12. wps云盘和zotero的结合(一)
  13. macOS 内核之 OS X 系统的起源
  14. 为什么阿里巴巴禁止使用 Executors 创建线程池,而是通过 ThreadPoolExecutor 方式?...
  15. 【UFUN开发板评测】小巧而不失精致,简单而不失内涵——uFun开发板开箱爆照...
  16. 小波变换 完美通俗解读【转载
  17. red5源码分析---12
  18. 关于职业能力倾向测试d类的软件,职业能力倾向测验D类及综合应用能力D类题型及分值...
  19. 读《why programs fail》的闲话
  20. android 面试 android 知识点 提高篇

热门文章

  1. 深入研究不平衡回归问题
  2. 风控外部数据源文章汇总
  3. 2022-2028全球与中国实时定位系统(RTLS)市场现状及未来发展趋势
  4. 全局分配数组、栈分配数组、堆分配数组在IDA反汇编中的不同——《IDA权威指南》例子尝试
  5. 关于动漫的计算机知识点,这些好看的动画片里竟然藏着许多知识点(附2019年观影日历)...
  6. FPGA操作WM8731音频编解码器从机模式,little white的自我进阶
  7. Java开发工程师面试题总结(一)
  8. 打开ftp服务器上的文件夹时发生错误,请检查是否有权限访问该文件夹
  9. Idea做spring项目所遇到的一些问题
  10. java阴阳师抽卡概率_阴阳师抽卡概率公布 阴阳师SSR/御魂抽取概率