请教一下,代码执行后,输入想要下载的电影名,得到的get(“href”)链接却无法下载,我看了看源代码标签,我获取到的HREF居然和源代码的迅雷下载地址不一样,我获取到的FREF和a标签的getText()是一样的(理论上获取到的连接应该和下列图片中的是一样的),有没有大神回答一下,这是怎么回事呢?

#引用requests和bs4(BeautifulSoup4的缩写),如果没有安装bs4,可以使用pip install beautifulsoup4下载。

from urllib.request import quote

import bs4

import requests

#quote函数,可以帮我们把内容转为标准的url格式,作为网址的一部分打开。

movie = input('输入你想下载的电影名:')

gbkmovie=movie.encode('gbk')

#将汉字,用gbk格式编码,赋值给gbkmovie。

urlmovie = 'http://s.ygdy8.com/plus/so.php?kwtype=0&searchtype=title&keyword='+quote(gbkmovie)

#将gbk格式的内容,转为url,然后和前半部分的网址拼接起来。

res =requests.get(urlmovie)

#下载水形物语的搜索页面

bsmovie = bs4.BeautifulSoup(res.text,'html.parser')

#解析网页。

link = bsmovie.select('.co_content8 b a')

#查找目标。

finallink = 'http://www.ygdy8.com' + link[0].get('href')

#得到电影下载页的地址。

xiazai = requests.get(finallink).content.decode('gbk')

#使用requests模块,拿到电影下载页的源代码。使用content方法,拿到bytes数据,再进行decode,此时xiazai是字符串。

bsxiazai = bs4.BeautifulSoup(xiazai,'html.parser')

#解析网页。因为此时的xiazai已经是字符串,所以不需要加text。

download = bsxiazai.select('table tbody tr td a')

#查找目标。

for x in download:

print (x.get('href'))

python下载电影链接_Python:输入电影名,爬获取到阳光电影网中对应名称的迅雷下载链接,获取的链接有点问题(具体问题在内容里)...相关推荐

  1. python下载电影天堂_Python爬虫初学:爬取电影天堂数据

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT共享之家,作者:IT共享者 [一.项目背景] 相信大家都有一种头疼的体验,要下载 ...

  2. 爬虫python下载文献代码_Python爬虫案例:爬取微信公众号文章

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 文章转载于公众号:早起Python 作者:陈熹 大家好,今天我们来讲点Selenium自动化,你是 ...

  3. python爬虫妹子图_Python 爬虫入门(二)——爬取妹子图

    Python 爬虫入门 听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. 公众号:[智能制造社区].欢迎关注,分享智能制造与编程那些事. 爬虫成果 当你运行代码后,文件夹就会 ...

  4. python微博爬虫实战_Python爬虫实战演练:爬取微博大V的评论数据

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT共享之家 ,作者: IT共享者 理论篇 试想一个问题,如果我们要抓取某个微博大V ...

  5. 从入门到入土:Python爬虫学习|实例练手|详细讲解|爬取腾讯招聘网|一步一步分析|异步加载|初级难度反扒处理|寻找消失的API来找工作吧

    此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...

  6. python爬虫scrapy爬取新闻标题及链接_python爬虫框架scrapy爬取梅花网资讯信息

    原标题:python爬虫框架scrapy爬取梅花网资讯信息 一.介绍 本例子用scrapy-splash爬取梅花网(http://www.meihua.info/a/list/today)的资讯信息, ...

  7. python输入变量输出常量_Python输入input、输出print

    1.输入input input是用于输入数据给变量.通过键盘输入的是字符串,如果需要其他格式,需要做转换.比如int.float类型数据,int() 如下是一个例子: 如果a不进行int转换,那么输入 ...

  8. python怎么显示分数_Python 输入一个数字判断成绩分数等级的方法

    Python 输入一个数字判断成绩分数等级的方法 成绩分数等级为: 100-90 A 90-80 B 80-70 C 70-60 D 60以下 F 实现判断分数等级是一个很简单的数学问题,只要你输入的 ...

  9. go爬虫和python爬虫哪个好_python 爬虫实战项目--爬取京东商品信息(价格、优惠、排名、好评率等)-Go语言中文社区...

    利用splash爬取京东商品信息 一.环境 window7 python3.5 pycharm scrapy scrapy-splash MySQL 二.简介 为了体验scrapy-splash 的动 ...

  10. python爬虫酷狗_python爬虫教程:爬取酷狗音乐,零基础小白也能爬取哦

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:python学习教程 ( 想要学习Python?Pyt ...

最新文章

  1. AI 开发指南:机器学习产品是什么?
  2. 实例演示如何在spring4.2.2中集成hibernate5.0.2并创建sessionFactory
  3. linux终端xwindow,如何从命令行重新启动X Window Server?
  4. android doc例程---Notepad Tutorial学习要点!
  5. selector的使用
  6. 第六章:如何在SpringBoot项目中使用拦截器
  7. linux重启mysql不动了,[转载]LINUX启动/重启/停上MYSQL的命令
  8. 列表与元组——Python基础语法
  9. oracle rman是干嘛的,我对Oracle RMAN备份的理解
  10. ubuntu 安装GPU黑屏 修改GRUB_安装Ubuntu 18.04系统的相关注意事项,及解决Ubuntu 双系统黑屏问题...
  11. 读取XML字符串到临时表
  12. 应用Composite模式
  13. 第六章 PCB 的 DRC 检查、拼版设计及资料输出
  14. matlab帧差法测速,matlab帧差法物体检测
  15. java连点方法,Re:连点器(示例代码)
  16. 免费云服务器(阿贝云服务器入门)(仅适用于windows server系统)
  17. RNN网络对新冠疫情进行预测
  18. 欲练神功必先自宫,String 自宫后“不可变性”到底有啥好处?
  19. 什么蓝牙耳机性价比高?四款高品质蓝牙耳机测评
  20. 论文笔记32 -- Conformer: Local Features Coupling Global Representations for Visual Recognition

热门文章

  1. 深入理解PSNR(峰值信噪比)(附matlab代码)
  2. python xy 官网_zwPython,字王集成式python开发平台,比pythonXY更强大、更方便。
  3. 日语学习|如何快速有效地记忆日语五十音图?
  4. Vbs脚本编程简明教程之六
  5. w3school在线学习教程 http://www.w3school.com.cn/
  6. 推荐姊妹篇:搜索中的深度匹配模型
  7. flash遮罩动画的使用技巧
  8. .json格式转为.yml格式
  9. mac excel mysql数据库_macOS系统的Excel从MySQL数据库查询数据的设置方法
  10. 用HTML简单制作一个网页