安装

pip install bs4

代码

import requests
from bs4 import BeautifulSoup
import timeurl = 'https://umei.cc/bizhitupian/weimeibizhi/'
domain = 'https://umei.cc'resp = requests.get(url)
resp.encoding = 'utf-8'
# print(resp.text)# 把网页源代码传给bs
page = BeautifulSoup(resp.text, 'html.parser')
a_list = page.find('div', class_='TypeList').find_all('a')
# print(a_list)
for a in a_list:# 使用get可以直接拿到属性值href = domain + a.get('href')child_resp = requests.get(href)child_resp.encoding = 'utf-8'child_content = child_resp.text# 从子页面中拿图片的下载路径child_page = BeautifulSoup(child_content, 'html.parser')p = child_page.find('p', align='center')# print(p)img = p.find('img')src = img.get('src')# 下载图片img_resp = requests.get(src)# 这里拿到的是字节# img_resp.contentimg_name = src.split('/')[-1]with open('img/' + img_name, mode='wb') as f:f.write(img_resp.content)f.close()print('Pic:{} download successfully!'.format(img_name))time.sleep(1)
resp.close()
print('All Over!')

效果

注意

把img文件夹标志为Excluded,这样Pycharm就不会建立索引,不然会很卡

Python爬虫:7_BeautifulSoup4图片爬取相关推荐

  1. Python爬虫实战之爬取网站全部图片(一)

    Python爬虫实战之爬取网站全部图片(二) Python爬虫实战之通过ajax获得图片地址实现全站图片下载(三) 一.获得图片地址 和 图片名称 1.进入网址之后 按F12  打开开发人员工具点击e ...

  2. Python爬虫学习笔记 -- 爬取糗事百科

    Python爬虫学习笔记 -- 爬取糗事百科 代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...

  3. Python爬虫入门(爬取豆瓣电影信息小结)

    Python爬虫入门(爬取豆瓣电影信息小结) 1.爬虫概念 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本.爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据. 2.基本流程 ...

  4. Python爬虫---影评的爬取

    Python爬虫-影评的爬取 介绍:爬虫练手,使用Requests库进行豆瓣影评的爬虫,做成词云图,写文章主要做一些问题解决的记录. 运行环境:python 3.8, Pycharm 关于在豆瓣爬取影 ...

  5. python爬虫——使用selenium爬取微博数据(一)

    python爬虫--使用selenium爬取微博数据(二) 写在前面 之前因为在组里做和nlp相关的项目,需要自己构建数据集,采用selenium爬取了几十万条微博数据,学习了很多,想在这里分享一下如 ...

  6. Python爬虫实战之爬取糗事百科段子

    Python爬虫实战之爬取糗事百科段子 完整代码地址:Python爬虫实战之爬取糗事百科段子 程序代码详解: Spider1-qiushibaike.py:爬取糗事百科的8小时最新页的段子.包含的信息 ...

  7. Python爬虫入门 | 5 爬取小猪短租租房信息

    小猪短租是一个租房网站,上面有很多优质的民宿出租信息,下面我们以成都地区的租房信息为例,来尝试爬取这些数据. 小猪短租(成都)页面:http://cd.xiaozhu.com/   1.爬取租房标题 ...

  8. Python爬虫实战之爬取百度贴吧帖子

    Python爬虫实战之爬取百度贴吧帖子 大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标 对百度贴吧的 ...

  9. Python爬虫学习之爬取淘宝搜索图片

    Python爬虫学习之爬取淘宝搜索图片 准备工作 因为淘宝的反爬机制导致Scrapy不能使用,所以我这里是使用selenium来获取网页信息,并且通过lxml框架来提取信息. selenium.lxm ...

  10. python多线程爬取多个网址_【Python爬虫】多线程爬取斗图网站(皮皮虾,我们上车)...

    原标题:[Python爬虫]多线程爬取斗图网站(皮皮虾,我们上车) 斗图我不怕 没有斗图库的程序猿是无助,每次在群里斗图都以惨败而告终,为了能让自己在斗图界立于不败之地,特意去网上爬取了斗图包.在这里 ...

最新文章

  1. RDSNet:统一目标检测和实例分割的新型网络
  2. c++学习总结:extern声明全局变量
  3. 2021中国华录杯·算法大赛活动进行中,超多奖励等你来拿
  4. c语言程序的入口是哪部分,C语言入口函数和LD_PRELOAD环境变量
  5. Linux有关Shell变量的笔记
  6. leetcode1177. 构建回文串检测(前缀和)
  7. javasript模块化
  8. 方向盘左右能摇动_金澳小贴士——通过方向盘,竟能看出这些汽车故障!
  9. 【CCNA Exploration 4.0 路由协议和概念3】
  10. Mysql:语法:标志符、关键字
  11. android 抽屉式滑动demo
  12. TSL237 简介
  13. 《焦虑心理学》——压力感篇
  14. css实现多行文本时显示省略号
  15. ultraiso刻录linux系统盘,使用UltraISO在Windows 10下刻录Ubuntu 18.04.2 U盘的方法
  16. JVM内置函数intrinsics简介
  17. 从0到1400star,从阮一峰周刊到尤雨溪推荐,小透明开源项目的2021年总结
  18. 上半年要完成的博客55
  19. pci-e插槽gen2 x4 link什么意思
  20. RabbitMQ镜像队列原理分析

热门文章

  1. AI面临产业大考:落地虽难,但产业化路径已日渐清晰
  2. ecshopnbsp;二次开发nbsp;全集
  3. acl审计软件_审计软件有哪些-审计软件的总结分析
  4. 夫妻给一周岁女儿喂农药后双双自杀
  5. AR涂涂乐⭐五、关于“4”的部分解决方案
  6. C++ Primer 笔记——IO类
  7. 中国数字经济投资态势分析及发展前景深度评估报告2022-2028年版
  8. 中国石油大学《微观经济学》在线考试
  9. 音视频开发(四)——编码音频
  10. k8s.gcr.io的镜像无法下载的问题