关于BeautifulSoup   :
soup.find_all(class_='v_picConBox mt15')
tag.find("div",{"class": "pic"})
pic.img['data-src']
title =text.span.em.a['title']
#coding=utf-8
import re,os
from urllib.request  import urlretrieve
import requests
from bs4 import BeautifulSoupdef geturl(url):html=requests.get(url).contentsoup=BeautifulSoup(html,'lxml')return soup#抓取电影海报
soup=geturl('http://dianying.2345.com/list/kehuan------.html')
bookAlbum=soup.title.string.split('_')[0]
# print(bookAlbum)
tags=soup.find_all(class_='v_picConBox mt15')
# print(tags)
movies=[]
for tag in tags[0].find_all('li'): pic=  tag.find("div",{"class": "pic"})  if  pic is None:continuetext = tag.find("div",{"class": "txtPadding"}) img_url = pic.img['data-src']title =text.span.em.a['title']# print(title,img_url)movies.append([title,img_url])print(movies)
if not os.path.exists(bookAlbum):os.makedirs(bookAlbum)for movie in movies:filename=os.path.join(bookAlbum,movie[0]+'.png')print(filename)with open(filename,'w') as f:urlretrieve('http:'+movie[1],filename)

【Python】抓取电影海报并下载相关推荐

  1. Python抓取电影天堂电影信息

    最近想做一个电影资讯的App,由于豆瓣不对外开发API了,正愁怎么录入数据呢.最近在学Python想想那就用它来抓取电影信息吧. Python2.7 Mac OS 抓取的是电影天堂里面最新电影的页面. ...

  2. python爬取电影天堂的下载链接

    python爬取电影天堂dytt8的下载链接 电影天堂下载链接都是magnet的,搞下来想下就下没有广告 建一个main.py 一个一个挨着去爬肯定慢啊,建一个多线程的去爬 mui.py 多线程有可能 ...

  3. 基于Python抓取电影天堂数据

    一.开头 在花了近半年的课余时间学习了Python的基础语法后开始尝试网页的抓取,学了一个星期,刚开始的抓取比较小的网页尝到甜头后,疯狂的找各种网页抓取,当然也被各种虐得反爬虐 - -! 于是决定认真 ...

  4. python抓取wallhaven首页壁纸

    python抓取wallhaven首页壁纸 """ 下载wallheaven首页图片,保存在同级文件夹image中 """ from bs4 ...

  5. python下载电影_Python抓取电影天堂电影信息的代码

    Python2.7Mac OS 抓取的是电影天堂里面最新电影的页面.链接地址: http://www.dytt8.net/html/gndy/dyzz/index.html 获取页面的中电影详情页链接 ...

  6. Python抓取腾视频所有电影,不用钱就可以看会员电影

    大家好,今天我们来学习如何抓取电影,实现看剧自由~ 运行环境 IDE丨pycharm 版本丨Python3.6 系统丨Windows 实现目的与思路 目的: 实现对腾讯视频目标url的解析与下载,由于 ...

  7. Python利用bs4批量抓取网页图片并下载保存至本地

    Python利用bs4批量抓取网页图片并下载保存至本地 使用bs4抓取网页图片,bs4解析比较简单,需要预先了解一些html知识,bs4的逻辑简单,编写难度较低.本例以抓取某壁纸网站中的壁纸为例.(b ...

  8. Python抓取淘女郎网页信息以及代码下载

    上一篇Python抓取糗事百科网页信息以及源码下载 也是利用python抓取网页信息,轻车熟路,知道一个之后,轻轻松松就是实现啦. 淘女郎网页地址:https://mm.taobao.com/json ...

  9. python抓取dblp网站的arXiv论文,下载保存成pdf

    python抓取dblp网站的arXiv论文,下载保存成pdf 需求 需要查找一些关于强化学习决策方面的论文,懒得一个一个下载,所以用python写了个脚本,在dblp网站上爬取论文. import ...

最新文章

  1. 【视频课】一课掌握模型设计核心理论与实战技巧
  2. 【软考-软件设计师】计算机系统基础知识
  3. Spark Streaming之updateStateByKey和mapWithState比较
  4. flutter 禁止冒泡_【Flutter】Switch开关组件
  5. C/C++的const区别
  6. 代码调试技巧【OI缩水版】
  7. MYSQL异常处理日志:主从库同步延迟时间过长的分析
  8. 计算机的应用主要遍布于,【应用】激光雕刻在各行业的应用
  9. 关于django后台界面的美化
  10. 基于Proteus学习单片机系列(九)——DA转换及其应用--TLC5615
  11. 24产品经理需要具备的用户动机分析能力
  12. iOS 应用Archiving问题
  13. Interface接口自动化登录图文验证码问题的解决办法
  14. 【TypeError: Descriptors cannot not be created directly. 】解决方法
  15. English--名词从句
  16. Java BMI计算程序
  17. keras 香草编码器_用香草javascript遍历dom
  18. 【汇总】 美股开户方法 、 美股开户攻略 、 美股开户流程 、 美股教程
  19. 中国互联网企业VS美国互联网企业
  20. 武汉大学信息管理学院莅临法大大交流

热门文章

  1. C# 实时折线图,波形图
  2. Opengl中的TBN矩阵的计算和使用
  3. 优秀php求职简历,[php程序员求职简历]php程序员就业方向
  4. esp32 s3 USB OTG Arduino可以下载固件 USB COM不可以的解决方法
  5. python将dataframe导出为csv_Pandas DataFrame如何转换为CSV?详细操作————
  6. 你是不是也,睡不着?
  7. 临沂市职业经理人协会举办第五届企业发展论坛
  8. app中接入微信H5支付总结
  9. 认证管理(锐捷无线篇)
  10. 【在线笔试题解题报告系列】Google APAC 2017 University Test Round E