python下载电影链接_Python:输入电影名,爬获取到阳光电影网中对应名称的迅雷下载链接,获取的链接有点问题(具体问题在内容里)...
请教一下,代码执行后,输入想要下载的电影名,得到的get(“href”)链接却无法下载,我看了看源代码标签,我获取到的HREF居然和源代码的迅雷下载地址不一样,我获取到的FREF和a标签的getText()是一样的(理论上获取到的连接应该和下列图片中的是一样的),有没有大神回答一下,这是怎么回事呢?
#引用requests和bs4(BeautifulSoup4的缩写),如果没有安装bs4,可以使用pip install beautifulsoup4下载。
from urllib.request import quote
import bs4
import requests
#quote函数,可以帮我们把内容转为标准的url格式,作为网址的一部分打开。
movie = input('输入你想下载的电影名:')
gbkmovie=movie.encode('gbk')
#将汉字,用gbk格式编码,赋值给gbkmovie。
urlmovie = 'http://s.ygdy8.com/plus/so.php?kwtype=0&searchtype=title&keyword='+quote(gbkmovie)
#将gbk格式的内容,转为url,然后和前半部分的网址拼接起来。
res =requests.get(urlmovie)
#下载水形物语的搜索页面
bsmovie = bs4.BeautifulSoup(res.text,'html.parser')
#解析网页。
link = bsmovie.select('.co_content8 b a')
#查找目标。
finallink = 'http://www.ygdy8.com' + link[0].get('href')
#得到电影下载页的地址。
xiazai = requests.get(finallink).content.decode('gbk')
#使用requests模块,拿到电影下载页的源代码。使用content方法,拿到bytes数据,再进行decode,此时xiazai是字符串。
bsxiazai = bs4.BeautifulSoup(xiazai,'html.parser')
#解析网页。因为此时的xiazai已经是字符串,所以不需要加text。
download = bsxiazai.select('table tbody tr td a')
#查找目标。
for x in download:
print (x.get('href'))
python下载电影链接_Python:输入电影名,爬获取到阳光电影网中对应名称的迅雷下载链接,获取的链接有点问题(具体问题在内容里)...相关推荐
- python下载电影天堂_Python爬虫初学:爬取电影天堂数据
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT共享之家,作者:IT共享者 [一.项目背景] 相信大家都有一种头疼的体验,要下载 ...
- 爬虫python下载文献代码_Python爬虫案例:爬取微信公众号文章
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 文章转载于公众号:早起Python 作者:陈熹 大家好,今天我们来讲点Selenium自动化,你是 ...
- python爬虫妹子图_Python 爬虫入门(二)——爬取妹子图
Python 爬虫入门 听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. 公众号:[智能制造社区].欢迎关注,分享智能制造与编程那些事. 爬虫成果 当你运行代码后,文件夹就会 ...
- python微博爬虫实战_Python爬虫实战演练:爬取微博大V的评论数据
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT共享之家 ,作者: IT共享者 理论篇 试想一个问题,如果我们要抓取某个微博大V ...
- 从入门到入土:Python爬虫学习|实例练手|详细讲解|爬取腾讯招聘网|一步一步分析|异步加载|初级难度反扒处理|寻找消失的API来找工作吧
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- python爬虫scrapy爬取新闻标题及链接_python爬虫框架scrapy爬取梅花网资讯信息
原标题:python爬虫框架scrapy爬取梅花网资讯信息 一.介绍 本例子用scrapy-splash爬取梅花网(http://www.meihua.info/a/list/today)的资讯信息, ...
- python输入变量输出常量_Python输入input、输出print
1.输入input input是用于输入数据给变量.通过键盘输入的是字符串,如果需要其他格式,需要做转换.比如int.float类型数据,int() 如下是一个例子: 如果a不进行int转换,那么输入 ...
- python怎么显示分数_Python 输入一个数字判断成绩分数等级的方法
Python 输入一个数字判断成绩分数等级的方法 成绩分数等级为: 100-90 A 90-80 B 80-70 C 70-60 D 60以下 F 实现判断分数等级是一个很简单的数学问题,只要你输入的 ...
- go爬虫和python爬虫哪个好_python 爬虫实战项目--爬取京东商品信息(价格、优惠、排名、好评率等)-Go语言中文社区...
利用splash爬取京东商品信息 一.环境 window7 python3.5 pycharm scrapy scrapy-splash MySQL 二.简介 为了体验scrapy-splash 的动 ...
- python爬虫酷狗_python爬虫教程:爬取酷狗音乐,零基础小白也能爬取哦
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:python学习教程 ( 想要学习Python?Pyt ...
最新文章
- AI 开发指南:机器学习产品是什么?
- 实例演示如何在spring4.2.2中集成hibernate5.0.2并创建sessionFactory
- linux终端xwindow,如何从命令行重新启动X Window Server?
- android doc例程---Notepad Tutorial学习要点!
- selector的使用
- 第六章:如何在SpringBoot项目中使用拦截器
- linux重启mysql不动了,[转载]LINUX启动/重启/停上MYSQL的命令
- 列表与元组——Python基础语法
- oracle rman是干嘛的,我对Oracle RMAN备份的理解
- ubuntu 安装GPU黑屏 修改GRUB_安装Ubuntu 18.04系统的相关注意事项,及解决Ubuntu 双系统黑屏问题...
- 读取XML字符串到临时表
- 应用Composite模式
- 第六章 PCB 的 DRC 检查、拼版设计及资料输出
- matlab帧差法测速,matlab帧差法物体检测
- java连点方法,Re:连点器(示例代码)
- 免费云服务器(阿贝云服务器入门)(仅适用于windows server系统)
- RNN网络对新冠疫情进行预测
- 欲练神功必先自宫,String 自宫后“不可变性”到底有啥好处?
- 什么蓝牙耳机性价比高?四款高品质蓝牙耳机测评
- 论文笔记32 -- Conformer: Local Features Coupling Global Representations for Visual Recognition
热门文章
- 深入理解PSNR(峰值信噪比)(附matlab代码)
- python xy 官网_zwPython,字王集成式python开发平台,比pythonXY更强大、更方便。
- 日语学习|如何快速有效地记忆日语五十音图?
- Vbs脚本编程简明教程之六
- w3school在线学习教程 http://www.w3school.com.cn/
- 推荐姊妹篇:搜索中的深度匹配模型
- flash遮罩动画的使用技巧
- .json格式转为.yml格式
- mac excel mysql数据库_macOS系统的Excel从MySQL数据库查询数据的设置方法
- 用HTML简单制作一个网页