更多教程请移步至:洛凉博客

大家可以登录下www.80s.tw网站,观察页面菜单。

最开始我是想把菜单下所有页面的都爬一遍。想想还是有点复杂。

image.png

但是最开始通过匹配,这些菜单的链接都拿到了。

单线程去写这些肯定和复杂,就放弃了。最后就攻下了电影菜单下的。

最开始也是用正则匹配迅雷(磁力)链接,但是匹配的有点问题。

最后直接用BS4解决了。

下面大家看代码吧。

import requests

from bs4 import BeautifulSoup

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}

def url_1(page_o,page_t):

url_s = []

for page in range(page_o,page_t):

url = 'http://www.80s.tw/movie/list/-----p'+str(page)

url_s.append(url)

return url_s

def html(url_s):

mv_urls = []

for url in url_s:

html = requests.get(url,headers=headers)

soup = BeautifulSoup(html.text,'lxml')

for mv in soup.find_all('h3',{'class','h3'}):

mv_url = mv('a')[0]['href']

mv_urls.append('http://www.80s.tw'+mv_url)

return mv_urls

def thlj(mv_urls):

num = 0

print('{0:^1}\t{1:^30}\t{2:^60}'.format('排序','电影名称', '迅雷链接或磁力链接'))

for thurl in mv_urls:

html = requests.get(thurl,headers=headers)

soup_t = BeautifulSoup(html.text,'lxml')

for xlurl in soup_t.find_all('span',{'class',"xunlei dlbutton1"}):

num+=1

xl_lj = xlurl('a')[0]['href']

xl_name = xlurl('a')[0]['thunderrestitle']

print('{0:^1}\t{1:^30}\t{2:^60}'.format(num,xl_name,xl_lj))

page_o = int(input('请输入需要爬取的开始页:'))

page_t = int(input('请输入需要爬取的结束页:'))

thlj(html(url_1(page_o,page_t)))

这些迅雷链接直接复制用迅雷就能下载了。还有一种磁力链接,我没用过,不知道怎么用。大家可以百度或谷歌下。

image.png

这些代码都是挺简单的,我也是个菜鸟,只是给自己的成果做个记录。

也没有太多的技术分享,还望大家见谅!!!

python linux下载磁力链_Python爬取80s网电影名称及迅雷(磁力)链接相关推荐

  1. python爬虫实例练习:爬取慕课网课程名称以及对应的链接

    1.安装与开发环境 模块安装: bs4 解析库安装:pip install bs4 开发环境: python 3.x + pycharm ps:文章来源于小编的头条号:"python数据科学 ...

  2. python 爬取贝壳网小区名称_Python爬虫实战:爬取贝壳网二手房40000条数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于啤酒就辣条 ,作者啤酒就辣条 一.网页分析 爬取贝壳网石家庄二 ...

  3. python爬取历史天气数据并保存_Python爬取天气网历史天气数据

    我的第一篇博客,哈哈哈,记录一下我的Python进阶之路! 今天写了一个简单的爬虫. 使用python的requests 和BeautifulSoup模块,Python 2.7.12可在命令行中直接使 ...

  4. python二手房价格预测_Python爬取赶集网北京二手房数据R对爬取的二手房房价做线性回归分析...

    前言:本文主要分为两部分:Python爬取赶集网北京二手房数据&R对爬取的二手房房价做线性回归分析.文章思路清晰,代码详细,特别适合刚刚接触Python&R的同学学习参考. Part1 ...

  5. [python爬虫] BeautifulSoup和Selenium简单爬取知网信息测试

    作者最近在研究复杂网络和知识图谱内容,准备爬取知网论文相关信息进行分析,包括标题.摘要.出版社.年份.下载数和被引用数.作者信息等.但是在爬取知网论文时,遇到问题如下:   1.爬取内容总为空,其原因 ...

  6. [python爬虫] BeautifulSoup和Selenium对比爬取豆瓣Top250电影信息

    这篇文章主要对比BeautifulSoup和Selenium爬取豆瓣Top250电影信息,两种方法从本质上都是一样的,都是通过分析网页的DOM树结构进行元素定位,再定向爬取具体的电影信息,通过代码的对 ...

  7. 请用Python写一个爬虫程序,爬取当当网图书畅销榜数据

    好的,下面是一个简单的 Python 爬虫代码,可以爬取当当网图书畅销榜数据: import requests from bs4 import BeautifulSoupurl = "htt ...

  8. python房价数据分析统计服_Python 爬取分析全国 12 个城市 4 万条房价信息,告诉你该怎样买房?...

    原标题:Python 爬取分析全国 12 个城市 4 万条房价信息,告诉你该怎样买房? 作者 | 月小水长 责编 | 伍杏玲通过分页.线程池.代理池等技术,快速爬取链家网近4万条在售二手房信息,速度可 ...

  9. python背景怎么自定义铃声_python爬取手机铃声

    相信每个人都会给自己的手机调一个好听的音乐作为铃声,但是对于iphone用户来说换铃声一般都会去找第三方平台来进行更换,众多平台当中不得不说的就是爱思手机助手,今天我将带你通过python爬虫来批量进 ...

最新文章

  1. [转载]Word直接发布新浪博客(以Word 2013为例)
  2. system diagnostics starts什么意思_System类
  3. 近期重构技能的一些心得
  4. [转]Delphi 2010 3513正式版破解
  5. 面向对象编程之生成器与迭代器
  6. 4~20mA模拟输出(电流环)应用笔记(转)
  7. php怎么循环输出二维数组,PHP中遍历二维数组—以不同形式的输出操作
  8. python-pycharm控制台输出带颜色
  9. 一文了解Innodb中的锁
  10. 你靠什么在单位立足?此文堪称经典
  11. 【学习笔记】函数高级使用技巧:建立函数队列
  12. scala下使用akka计算圆周率pi
  13. 月薪3万Java优秀简历模板
  14. 西门子scl语言和c语言,为什么说SCL将成为西门子PLC的主流编程语言
  15. Zeta电位计算理论
  16. java开发mdm平台_Apple iOS MDM开发流程
  17. python3.8安装pyltp
  18. php刮刮卡代码,基于PHP代码实现中奖概率算法可用于刮刮卡、大转盘等抽奖算法_php实例...
  19. 神器vimium:比同级程序员成长更快,我主要靠它
  20. gcr.io 国内源 —— 基于 Travis CI + GitHub + DockerHub + Google Cloud 实现自动定时同步 gcr.io 镜像到 DockerHub

热门文章

  1. 微信Mac正式版上线!!不仅支持发布朋友圈,还能浏览朋友圈相册
  2. 微软常用运行库合集,电脑必备组件
  3. Linux shell 常用代码片断
  4. 设计模式-原型模式与模板方法模式的对比总结
  5. js拖拽图片到浏览器
  6. 局域网、广域网、城域网的介绍,
  7. <Zhuuu_ZZ>数据库设计:吃货联盟
  8. iDownsV1.8.4资源素材教程下载类WordPress
  9. 计算机无法共享磁盘分区,win7怎么共享电脑C盘,D盘,E盘,F盘,桌面-win7磁盘共享,win7磁盘共享灰色...
  10. 达内—创新与开发大会隆重召开