安装

pip install bs4

代码

import requests
from bs4 import BeautifulSoup
import timeurl = 'https://umei.cc/bizhitupian/weimeibizhi/'
domain = 'https://umei.cc'resp = requests.get(url)
resp.encoding = 'utf-8'
# print(resp.text)# 把网页源代码传给bs
page = BeautifulSoup(resp.text, 'html.parser')
a_list = page.find('div', class_='TypeList').find_all('a')
# print(a_list)
for a in a_list:# 使用get可以直接拿到属性值href = domain + a.get('href')child_resp = requests.get(href)child_resp.encoding = 'utf-8'child_content = child_resp.text# 从子页面中拿图片的下载路径child_page = BeautifulSoup(child_content, 'html.parser')p = child_page.find('p', align='center')# print(p)img = p.find('img')src = img.get('src')# 下载图片img_resp = requests.get(src)# 这里拿到的是字节# img_resp.contentimg_name = src.split('/')[-1]with open('img/' + img_name, mode='wb') as f:f.write(img_resp.content)f.close()print('Pic:{} download successfully!'.format(img_name))time.sleep(1)
resp.close()
print('All Over!')

效果

注意

把img文件夹标志为Excluded，这样Pycharm就不会建立索引，不然会很卡

Python爬虫：7_BeautifulSoup4图片爬取相关推荐

Python爬虫实战之爬取网站全部图片(一)
Python爬虫实战之爬取网站全部图片(二) Python爬虫实战之通过ajax获得图片地址实现全站图片下载(三) 一.获得图片地址和图片名称 1.进入网址之后按F12 打开开发人员工具点击e ...
Python爬虫学习笔记 -- 爬取糗事百科
Python爬虫学习笔记 -- 爬取糗事百科代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...
Python爬虫入门（爬取豆瓣电影信息小结）
Python爬虫入门(爬取豆瓣电影信息小结) 1.爬虫概念网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本.爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据. 2.基本流程 ...
Python爬虫---影评的爬取
Python爬虫-影评的爬取介绍:爬虫练手,使用Requests库进行豆瓣影评的爬虫,做成词云图,写文章主要做一些问题解决的记录. 运行环境:python 3.8, Pycharm 关于在豆瓣爬取影 ...
python爬虫——使用selenium爬取微博数据（一）
python爬虫--使用selenium爬取微博数据(二) 写在前面之前因为在组里做和nlp相关的项目,需要自己构建数据集,采用selenium爬取了几十万条微博数据,学习了很多,想在这里分享一下如 ...
Python爬虫实战之爬取糗事百科段子
Python爬虫实战之爬取糗事百科段子完整代码地址:Python爬虫实战之爬取糗事百科段子程序代码详解: Spider1-qiushibaike.py:爬取糗事百科的8小时最新页的段子.包含的信息 ...
Python爬虫入门 | 5 爬取小猪短租租房信息
小猪短租是一个租房网站,上面有很多优质的民宿出租信息,下面我们以成都地区的租房信息为例,来尝试爬取这些数据. 小猪短租(成都)页面:http://cd.xiaozhu.com/ 1.爬取租房标题 ...
Python爬虫实战之爬取百度贴吧帖子
Python爬虫实战之爬取百度贴吧帖子大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标对百度贴吧的 ...
Python爬虫学习之爬取淘宝搜索图片
Python爬虫学习之爬取淘宝搜索图片准备工作因为淘宝的反爬机制导致Scrapy不能使用,所以我这里是使用selenium来获取网页信息,并且通过lxml框架来提取信息. selenium.lxm ...
python多线程爬取多个网址_【Python爬虫】多线程爬取斗图网站（皮皮虾，我们上车）...
原标题:[Python爬虫]多线程爬取斗图网站(皮皮虾,我们上车) 斗图我不怕没有斗图库的程序猿是无助,每次在群里斗图都以惨败而告终,为了能让自己在斗图界立于不败之地,特意去网上爬取了斗图包.在这里 ...

Python爬虫：7_BeautifulSoup4图片爬取

安装

代码

效果

注意

Python爬虫：7_BeautifulSoup4图片爬取相关推荐

最新文章

热门文章