Python简单爬虫,爬取图片
一个简单的爬虫,爬取古装美女的图片,并保存在磁盘里边
版本:py3.7.1
直接粘贴代码
# -*- coding:utf-8 -*-
import os
import requests
import re
from bs4 import BeautifulSoup
# 爬取图片的地址
url = "http://www.27270.com/zt/guzhuang/" # 古装美女
# 获取网页内容
htmls = requests.get(url).textsoup = BeautifulSoup(htmls, 'html.parser', from_encoding='utf-8')
# findall() 全局搜索,搜索到所有img标签的元素
pic_url = soup.find_all('img', src=re.compile(r'^http://t2.hddhhn.com/uploads/tu(.*)jpg$'))i = 0
# 判断images文件夹是否存在,如果不存在,则创建
if not os.path.exists('images'):os.makedirs('images')
# 利用for循环遍历图片的地址
for url in pic_url:img = url['src']try:pic = requests.get(img,timeout=5) # 超时异常判断 5秒超时except requests.exceptions.ConnectionError:print("图片无法下载")continuefile_name = "images/"+ str(i) + ".jpg" # 存储图片的路径及保存的名字print(file_name)fp = open(file_name,'wb+')fp.write(pic.content) # 写入图片fp.close() # 关闭i += 1
效果如下图:
Python简单爬虫,爬取图片相关推荐
- python爬取百度百科词条-python简单爬虫爬取百度百科python词条网页
目标分析: 目标:百度百科python词条相关词条网页 - 标题和简介 入口页:https://baike.baidu.com/item/Python/407313 URL格式: - 词条页面URL: ...
- Python 异步爬虫爬取图片
周末没什么事,想温习一下以前学过的python爬虫,抓了一些图片,发现优点慢,于是改成了异步爬虫,用了几个异步的库 同步方法 import requests from lxml import etre ...
- Python网络爬虫爬取图片
环境: 我的是Linux系统 环境:python3.7.2 软件:Pycharm(或者直接用命令行操作也行) 进入正题: 本人是胡歌的粉,爬取一下豆瓣里的琅琊榜页面的一些图片,hhhhh 网址:htt ...
- python爬虫爬取图片无法打开_半小时入门python爬虫爬下网站图片,不能再简单了...
阅读本文大约需要2分钟 本文旨在为没有爬虫基础的,偶尔想爬虫爬一下某个网站上的图片的初学者使用,如果你已经是对爬虫很熟悉了,下面依然有你感兴趣的东西. 我最近也才正儿八经学习了下爬虫,出于某种需要爬一 ...
- 【大学生课程实践】实操:使用Python爬虫爬取图片
实操:使用Python爬虫爬取图片 参考链接: 源码部署 安装源码中的爬虫库 创建 images文件 参考链接: 本博客作为大佬博客学习笔记记录 参考链接:孩子说"你没看过奥特曼" ...
- Python简单爬虫入门-爬取链家租房网上的租房信息
.又到了毕业季,租房成为广大毕业生关注的话题,考虑到只用到广州的租房信息,所以只爬取广州各个地区的租房信息,下面是用Python3.4.4编写简单爬虫爬取租房网信息的代码: #coding:utf-8 ...
- python爬电影_使用Python多线程爬虫爬取电影天堂资源
最近花些时间学习了一下Python,并写了一个多线程的爬虫程序来获取电影天堂上资源的迅雷下载地址,代码已经上传到GitHub上了,需要的同学可以自行下载.刚开始学习python希望可以获得宝贵的意见. ...
- Python:网络爬虫爬取某表情包网站
Python:网络爬虫爬取某表情包网站 参考: 爬虫基础知识点汇总(html文件基础和4个常用库 超级详细长文预警) [爬虫教程]吐血整理,最详细的爬虫入门教程~ HTML的简单介绍 HTML的全称为 ...
- Python 简单爬虫下载小说txt
Python 简单爬虫下载小说txt #第一次写爬虫代码 欢迎交流指正 我们范例爬取的对象是笔趣阁的<圣墟> (最近非常火的连载小说) ##为什么选择笔趣阁# 主要是因为笔趣阁的源代码没有 ...
- Python简单爬虫第六蛋!(完结撒花)
第六讲: 今天我们来实战一个项目,我本人比较喜欢看小说,有一部小时叫<圣墟>不知道大家有没有听说过,个人觉得还是不错的,现在联网的时候,都可以随时随地用手机打开浏览器搜索查看,但是有时候也 ...
最新文章
- We cannot activate inspection type for article master in transaction code MM41?
- HDU 5289 Assignment(单调队列)
- 较全的jdom使用教程
- linux screen 常用命令
- java环境教程_window下Java环境配置图文教程
- 【机器学习基础】Softmax与交叉熵的数学意义(信息论与概率论视角)
- 深度学习-Tensorflow2.2-Eager模式与自定义训练{4}-微分运算训练练习-16
- vue移动端弹框组件
- 基于 Kong 和 Kubernetes 的 WebApi 多版本解决方案
- 微型计算机原理及其应用彭楚武答案第三章,微机原理及其应用_第1章.ppt
- jsp中从mysql导出数据格式_MySQL导入导出.sql文件方法(转载)
- 存储技术论坛:最高可用级别的同步复制及方案
- 数据库decimal对应java什么类型_mysql decimal(10,2)对应java类型
- OpenCV环境搭建(Windows+Visual studio)及Hello World
- android studio 融云SDK集成
- bzoj 4816 [Sdoi2017]数字表格——反演
- python小游戏之超级玛丽进阶版(1~4关)。好玩到爆炸~【内附github源码,及其详细备注】
- {转载}——jvm verbose 参数详解
- Python学习日志--摆动吧!钟摆!
- 什么是Redis哨兵机制?
热门文章
- pandas中min()函数的应用
- 【原创】OPTIONS请求之跨域请求被阻止(原因:CORS预检通道未成功)解决方案 超神!牛逼!
- Qt开发之Rust篇(一)
- C++映射——魔咒词典
- 西安交通大学软件工程专业笔记补全计划
- html div相对位置,div的相对定位与绝对定位
- 猴子吃桃问题(C语言解答附解题思路)
- oracle中sysdate的变更,oracle – 使用sysdate的to_date函数
- 财富创造财富,为什么没有女人是没用的
- c语言编写一个程序,将一个十进制数转换为二进制数,c语言编写一个程序,将十进制整数n 转换成二进制数...