【Python】抓取电影海报并下载
关于BeautifulSoup :
soup.find_all(class_='v_picConBox mt15')
tag.find("div",{"class": "pic"})
pic.img['data-src']
title =text.span.em.a['title']
#coding=utf-8
import re,os
from urllib.request import urlretrieve
import requests
from bs4 import BeautifulSoupdef geturl(url):html=requests.get(url).contentsoup=BeautifulSoup(html,'lxml')return soup#抓取电影海报
soup=geturl('http://dianying.2345.com/list/kehuan------.html')
bookAlbum=soup.title.string.split('_')[0]
# print(bookAlbum)
tags=soup.find_all(class_='v_picConBox mt15')
# print(tags)
movies=[]
for tag in tags[0].find_all('li'): pic= tag.find("div",{"class": "pic"}) if pic is None:continuetext = tag.find("div",{"class": "txtPadding"}) img_url = pic.img['data-src']title =text.span.em.a['title']# print(title,img_url)movies.append([title,img_url])print(movies)
if not os.path.exists(bookAlbum):os.makedirs(bookAlbum)for movie in movies:filename=os.path.join(bookAlbum,movie[0]+'.png')print(filename)with open(filename,'w') as f:urlretrieve('http:'+movie[1],filename)
【Python】抓取电影海报并下载相关推荐
- Python抓取电影天堂电影信息
最近想做一个电影资讯的App,由于豆瓣不对外开发API了,正愁怎么录入数据呢.最近在学Python想想那就用它来抓取电影信息吧. Python2.7 Mac OS 抓取的是电影天堂里面最新电影的页面. ...
- python爬取电影天堂的下载链接
python爬取电影天堂dytt8的下载链接 电影天堂下载链接都是magnet的,搞下来想下就下没有广告 建一个main.py 一个一个挨着去爬肯定慢啊,建一个多线程的去爬 mui.py 多线程有可能 ...
- 基于Python抓取电影天堂数据
一.开头 在花了近半年的课余时间学习了Python的基础语法后开始尝试网页的抓取,学了一个星期,刚开始的抓取比较小的网页尝到甜头后,疯狂的找各种网页抓取,当然也被各种虐得反爬虐 - -! 于是决定认真 ...
- python抓取wallhaven首页壁纸
python抓取wallhaven首页壁纸 """ 下载wallheaven首页图片,保存在同级文件夹image中 """ from bs4 ...
- python下载电影_Python抓取电影天堂电影信息的代码
Python2.7Mac OS 抓取的是电影天堂里面最新电影的页面.链接地址: http://www.dytt8.net/html/gndy/dyzz/index.html 获取页面的中电影详情页链接 ...
- Python抓取腾视频所有电影,不用钱就可以看会员电影
大家好,今天我们来学习如何抓取电影,实现看剧自由~ 运行环境 IDE丨pycharm 版本丨Python3.6 系统丨Windows 实现目的与思路 目的: 实现对腾讯视频目标url的解析与下载,由于 ...
- Python利用bs4批量抓取网页图片并下载保存至本地
Python利用bs4批量抓取网页图片并下载保存至本地 使用bs4抓取网页图片,bs4解析比较简单,需要预先了解一些html知识,bs4的逻辑简单,编写难度较低.本例以抓取某壁纸网站中的壁纸为例.(b ...
- Python抓取淘女郎网页信息以及代码下载
上一篇Python抓取糗事百科网页信息以及源码下载 也是利用python抓取网页信息,轻车熟路,知道一个之后,轻轻松松就是实现啦. 淘女郎网页地址:https://mm.taobao.com/json ...
- python抓取dblp网站的arXiv论文,下载保存成pdf
python抓取dblp网站的arXiv论文,下载保存成pdf 需求 需要查找一些关于强化学习决策方面的论文,懒得一个一个下载,所以用python写了个脚本,在dblp网站上爬取论文. import ...
最新文章
- 【视频课】一课掌握模型设计核心理论与实战技巧
- 【软考-软件设计师】计算机系统基础知识
- Spark Streaming之updateStateByKey和mapWithState比较
- flutter 禁止冒泡_【Flutter】Switch开关组件
- C/C++的const区别
- 代码调试技巧【OI缩水版】
- MYSQL异常处理日志:主从库同步延迟时间过长的分析
- 计算机的应用主要遍布于,【应用】激光雕刻在各行业的应用
- 关于django后台界面的美化
- 基于Proteus学习单片机系列(九)——DA转换及其应用--TLC5615
- 24产品经理需要具备的用户动机分析能力
- iOS 应用Archiving问题
- Interface接口自动化登录图文验证码问题的解决办法
- 【TypeError: Descriptors cannot not be created directly. 】解决方法
- English--名词从句
- Java BMI计算程序
- keras 香草编码器_用香草javascript遍历dom
- 【汇总】 美股开户方法 、 美股开户攻略 、 美股开户流程 、 美股教程
- 中国互联网企业VS美国互联网企业
- 武汉大学信息管理学院莅临法大大交流
热门文章
- C# 实时折线图,波形图
- Opengl中的TBN矩阵的计算和使用
- 优秀php求职简历,[php程序员求职简历]php程序员就业方向
- esp32 s3 USB OTG Arduino可以下载固件 USB COM不可以的解决方法
- python将dataframe导出为csv_Pandas DataFrame如何转换为CSV?详细操作————
- 你是不是也,睡不着?
- 临沂市职业经理人协会举办第五届企业发展论坛
- app中接入微信H5支付总结
- 认证管理(锐捷无线篇)
- 【在线笔试题解题报告系列】Google APAC 2017 University Test Round E