python爬虫爬取网页壁纸图片(《底特律:变人》)
参考文章:https://www.cnblogs.com/franklv/p/6829387.html
爬虫爬取网址:http://www.gamersky.com/news/201804/1039678.shtml
此网页为静态网页,双层套图,无需登录
下面附上一个图片的两张套图的源码截图:
附上源码:
import requests
from bs4 import BeautifulSoup
import os
import redef getHtmlurl(url): #获取网址try:r=requests.get(url)r.raise_for_status()r.encoding=r.apparent_encodingreturn r.textexcept:return ""def getpic(html): #获取图片地址并下载soup =BeautifulSoup(html,'html.parser')all_p=soup.find('div',class_='Mid2L_con').find_all("p",attrs={'align':'center'})for p in all_p:img_i=p.find('a')img_h=img_i['href']img_url=img_h.split('?')[-1]title=img_url.split('/')[-1].split('.')[0]print (img_url)root='/home/suwex/图片/'#root='/home/suwex/test2/'path = root + title[:22] + '.jpg'try: #创建或判断路径图片是否存在并下载if not os.path.exists(root):os.mkdir(root)if not os.path.exists(path):r = requests.get(img_url)with open(path, 'wb') as f:f.write(r.content)f.close()print("文件保存成功")else:print("文件已存在")except:print("爬取失败")def main():for i in range(1,12):if i==1:url='http://www.gamersky.com/news/201804/1039678.shtml'else:url='http://www.gamersky.com/news/201804/1039678_' + str(i) +'.shtml'html=(getHtmlurl(url))print(str(i)+" : ")print(getpic(html))
main()
python爬虫爬取网页壁纸图片(《底特律:变人》)相关推荐
- 用python爬虫爬取网页壁纸图片(彼岸桌面网唯美图片)
参考文章:https://www.cnblogs.com/franklv/p/6829387.html 今天想给我的电脑里面多加点壁纸,但是嫌弃一个个保存太慢,于是想着写个爬虫直接批量爬取,因为爬虫只 ...
- python唯美壁纸_用python爬虫爬取网页壁纸图片(彼岸桌面网唯美图片)
参考文章:https://www..com/franklv/p/6829387.html 今天想给我的电脑里面多加点壁纸,但是嫌弃一个个保存太慢,于是想着写个爬虫直接批量爬取,因为爬虫只是很久之前学过 ...
- 利用Python爬虫爬取网页福利图片
最近几天,学习了爬虫算法,通过参考书籍,写下自己简单爬虫项目: 爬取某福利网站的影片海报图片 环境:anaconda3.5+spyder3.2.6 目录 1.本节目标 2.准备工作 3.抓取分析 4. ...
- Python爬虫-爬取wallhaven壁纸
Python爬虫-爬取wallhaven壁纸 前言 可行性分析 功能介绍 效果展示 基本思路 1.获取每页(1页24张)壁纸的url 2.获取每张壁纸缩略图的url 3.获取壁纸原图下载的url 4. ...
- 使用Python爬虫爬取网络美女图片
代码地址如下: http://www.demodashi.com/demo/13500.html 准备工作 安装python3.6 略 安装requests库(用于请求静态页面) pip instal ...
- Python爬虫爬取网页数据并存储(一)
Python爬虫爬取网页数据并存储(一) 环境搭建 爬虫基本原理 urllib库使用 requests库使用 正则表达式 一个示例 环境搭建 1.需要事先安装anaconda(或Python3.7)和 ...
- python爬虫爬取网页新闻标题-看完保证你会
python爬虫爬取网页新闻标题方法 1.首先使用浏览自带的工具--检查,查找网页新闻标题对应的元素位置,这里查到的新闻标题是在 h3 标签中 2.然后使用编辑器编写python代码 2.1方法一: ...
- python爬虫爬取网页图片_Python爬虫:爬取网页图片
先分析查找要爬取图片的路径 在浏览器F12 审查元素 整体实现代码 # -- coding:UTF-8 -- import requests from bs4 import BeautifulSoup ...
- 上手快!!福利局!新手如何使用python爬虫爬取网页图片(使用正则进行数据解析)当然这个新手是我自己
作为一个python新入门小白,突然就想发个博客,一方面为了记录学习历程,一方面能分享给新入门的同学经验,更多的是想和大家一起学习和交流.以下是我以小白的角度分享的爬虫的相关知识和一个简单的爬取网页图 ...
最新文章
- html中sprite标签,Three.js模型标签
- window 服务(二)
- 面试:讲一讲Spring中的循环依赖
- 【Windows 逆向】内存地址分析 ( 动态地址 | 静态地址 | 偏移量 )
- educoder SML程序设计题线下编译环境搭建
- 【Pandas】qcut和cut的区别
- 传统的Web应用程序和RESTful API
- 一年月份大小月口诀_怎么看自己的日柱 公式 推算口诀 最简便计算方法
- idea 提示接口注释信息
- 集群(cluster)amp;高可用性(HA)概念
- 三伏天里小试牛刀andriod 开发 #华为云·寻找黑马程序员#
- iOS---实现在屏幕上实时绘图的简单效果---CAShaperLayer和UIBezierPath的简单运用
- Unity3D ParticleSystem粒子系统
- CF 613C(Necklace-构造法)
- 电商后台设计:系统消息
- 游戏3D美术设计就业前景如何?现在饱和了吗
- springBoot启动错误:Field categoryMapper in xxx.xxx.service.impl.CategoryServiceImpl required a bean of
- 中国大学MOOC C语言程序设计(大连理工大学) 课后编程题 第五周题解(个人向仅供参考)
- 戴尔服务器720dx格式化硬盘,《图解戴尔iDRAC服务器远程控制设置》.docx
- 实现复数类中的运算符重载(含有double类型)