# 爬取豆瓣碟中谍图片
import requests
from bs4 import BeautifulSoup
# python3 中的urllib没有下载方法urlretrieve,这里需要引入 urllib.request ,调用urllib.request的urlretrieve方法进行下载。
import urllib.request
import time
import os
url = "https://movie.douban.com/subject/26336252/celebrities"
head = {"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36"}
res = requests.get(url, headers = head)
res.encoding = "utf-8"
# print(res.text)
soup = BeautifulSoup(res.text,"lxml")
# fileurl = "e:\pythonFile\碟中谍\\"
# if os.path.exists(fileurl) == False:
#     os.mkdir(fileurl)
# with open(fileurl+"dzd.txt","w+",encoding = "utf-8-sig") as f:
#     f.write(res.text)
plists = soup.select(".celebrity")
print(len(plists))
dataList = []
for plist in plists:print(plist.select("a")[0]["title"]+"------"+plist.select("div")[0]["style"][22:-1])temp = (plist.select("a")[0]["title"].strip(),plist.select("div")[0]["style"][22:-1])dataList.append(temp)
# 创建文件夹,将图片下载到文件夹中
picDir = "e:\pythonFile\碟中谍图片\\"
if os.path.exists(picDir) == False:os.makedirs(picDir)
index = 1
for a,b in dataList:urllib.request.urlretrieve(b,picDir+a+".png")print("下载第"+str(index)+"个")index = index + 1time.sleep(0.01)

python爬取豆瓣图片相关推荐

  1. python爬取豆瓣电影评论_python 爬取豆瓣电影评论,并进行词云展示及出现的问题解决办法...

    def getHtml(url): """获取url页面""" headers = {'User-Agent':'Mozilla/5.0 ( ...

  2. python爬取豆瓣读书并进行图形化分析

    python爬取豆瓣读书并进行图形化分析 豆瓣读书网页数据爬取并保存至csv 对数据进行分析并汇成图形 绘制散点图 图形效果展示 以下代码内容大多是团队小伙伴的杰作,而本人只是为了能让更多的人学习到知 ...

  3. python爬取豆瓣电影top250_Python爬虫——爬取豆瓣电影Top250代码实例

    利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...

  4. 详解使用Python爬取豆瓣短评并绘制词云

    使用Python爬取豆瓣短评并绘制词云 成果如下(比较丑,凑合看) 1.分析网页 打开想要爬取的电影,比如<找到你>,其短评如下: 查看源代码 发现短评存放在<span>标签里 ...

  5. Python爬取豆瓣《复仇者联盟3》评论并生成乖萌的格鲁特

    代码地址如下: http://www.demodashi.com/demo/13257.html 1. 需求说明 本项目基于Python爬虫,爬取豆瓣电影上关于复仇者联盟3的所有影评,并保存至本地文件 ...

  6. python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例

    利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...

  7. python 爬取豆瓣top100电影页面

    python 爬取豆瓣top100电影页面 运行结果截图: 代码: (原网站:https://movie.douban.com/top250) 1.将页面保存 避免多次访问 (登陆状态需页面cooki ...

  8. 利用python爬取豆瓣电影top250

    利用python爬取豆瓣电影top250: 注:本内容只是作为个人学习记录 1.业务分析 进入网页https://movie.douban.com/top250 可以看见每部电影都呈现在眼前,点击电影 ...

  9. Python爬取豆瓣电影top250的电影信息

    Python爬取豆瓣电影top250的电影信息 前言 一.简介 二.实例源码展示 小结 前言 相信很多小伙伴在学习网络爬虫时,老师们会举一些实例案例讲解爬虫知识,本文介绍的就是经典爬虫实际案例–爬取豆 ...

最新文章

  1. 单摆运动属于什么现象_在学习高中物理中有什么好的经验可以分享?
  2. io在Linux,在Linux进行IO的正确姿势
  3. 【FPGA】SRIO IP核系统介绍之事务类型(Transaction)
  4. 第二冲刺站立会议01
  5. 知识在于积累和分类,厚积薄发
  6. 七十一、去重交换排序链表、 求链表的中间结点
  7. 节能原理 复习(能量平衡+热电联产+联合循环)
  8. (周日赛)Sort the Array
  9. js new Date 创建时间默认是8点
  10. 对话猿辅导:阿里云远程办公零信任落地创新安全
  11. Web存储—获取Cookie
  12. Altium AD20更改原理图背景颜色
  13. Java应用案例分析_Java应用启动参数实例解析
  14. c 与mysql连接_c与mysql的连接
  15. 再谈如何写好技术文档?
  16. c语言编程定积分sinx,C语言用辛普森公式求sinx在0到π上的定积分的源程序
  17. Markdown基本语法
  18. 昆仑通泰高级教程_2014-昆仑通态-高级教程.pdf
  19. thinkphp5 layui分页样式
  20. win10服务器权限修改时间,Win10没有权限修改系统时间如何解决?

热门文章

  1. 使用JDBC技术完成一个简单的账务管理系统
  2. 一个价值一千五的外包项目!抓取大众点评的店铺信息!
  3. 黑白影片智能上色,复原历史重现经典
  4. 图卷积神经网络代码讲解,cnn卷积神经网络伪代码
  5. python科学计算最佳实践下载百度云_Python科学计算最佳实践 SciPy指南
  6. win10家庭版无法进入mysql_win10家庭版安装不了MySQL server 5.7.19解决方法
  7. python可以用于excel计算吗_你好Python!再见Excel?
  8. 电脑系统--问题解决
  9. 填补行业空白《数据中心机房搬迁实用指南》发布会成功举办
  10. Jmeter断言操作