python2

+ 修改基础存储路径

+ 给map里面添加源url和存储文件夹,k-v对。

# -*- coding: utf-8 -*-

import re

import urllib

import urllib2

import os

# 抓取网页图片

# 根据给定的网址来获取网页详细信息,得到的html就是网页的源代码

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

def saveImages(imglist, storeFilePath):

number = 1

for imageURL in imglist:

splitPath = imageURL.split('//')

wwwUrl = splitPath.pop()

splitPath2 = wwwUrl.split('/')

picName = splitPath2.pop()

fileName = storeFilePath + picName

# 对于每张图片地址,进行保存

try:

u = urllib2.urlopen(imageURL)

data = u.read()

f = open(fileName, 'wb+')

f.write(data)

print '正在保存的一张图片:', fileName

f.close()

except urllib2.URLError as e:

print(e.reason)

number += 1

# 获取网页中所有图片的地址

def getAllImg(html):

# 利用正则表达式把源代码中的图片地址过滤出来

reg = r'href="(.+?\.jpg)"'

# https://www.ghibli.jp/gallery/thumb-laputa001.png

imgre = re.compile(reg)

imglist = imgre.findall(html) # 表示在整个网页中过滤出所有图片的地址,放在imglist中

return imglist

# 创建本地保存文件夹,并下载保存图片

if __name__ == '__main__':

baseFilePath = '/Users/shaopengyang/pic/'

map = { "https://www.ghibli.jp/works/umi/#frame":'umi',

"https://www.ghibli.jp/works/majo/#frame":'majo',

"https://www.ghibli.jp/works/howl/#frame":'howl'}

for url, filePath in map.items():

html = getHtml(url)

imgList = getAllImg(html)

# 判断存储路径是否存在

isExists = os.path.exists(baseFilePath + filePath + '/')

if not isExists:

os.makedirs(baseFilePath + filePath + '/')

saveImages(imgList, baseFilePath + filePath + '/')

python高清大图代码_python2的代码从吉卜力网页上下载高清图片相关推荐

  1. 使用JSP代码编写index.jsp文件在网页上显示数据库数据

    使用JSP代码编写index.jsp文件在网页上显示数据库数据 在index.jsp文件上使用JSP代码编写 可以在网页上以表格的形式显示数据库 内的数据 需要创建一个项目 因为需要用到关于JDBC的 ...

  2. 如何在Google上下载高清原图

    在我们学习和生活中常常一些高清图片作为相关的素材,比如制作PPT.写博文.制作视频都需要大量图片.我们常常会在百度上下载一些图片,但是百度上提供的图片存在很多问题:存在水印.清晰度不够等.而Googl ...

  3. 用Python批量把EXCEL表格中的数据提交到网页上

    因为工作的需要,要在网页上添加很多学员的信息,但是公司审计不让直接导入数据库,而且开发也没有涉及批量上传的功能,只好自己动手用Python写了一个批量创建学生信息的程序. 实现思路: 我们首先看我们需 ...

  4. python金融代码_Python2爬虫代码之获取金融品种行情数据

    #!/usr/bin/env python # -*- coding: utf-8 -*- import requests #使用requests包方便 import json #导入json模块 i ...

  5. 【代码笔记】iOS-播放从网络上下载的语音

    代码: ViewController.m #import "ViewController.h" //录音 #import <AVFoundation/AVFoundation ...

  6. 这些假脸实在太逼真了!英伟达造出新一代GAN,生成壁纸级高清大图毫无破绽...

    栗子 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 不敢相信,上面这些人脸,全都是假的. 是英伟达的AI生成的. 借用风格迁移的思路,团队为GAN创造了一种新的生成器. 连GAN之父G ...

  7. 斗破苍穹-云韵 AI生成高清大图

    1080*1920高清大图,1000张,人工智能机器学习生成的AI高清古装仙侠美女图,云岚宗宗主云韵. 云韵,天蚕土豆所著异世大陆类玄幻小说<斗破苍穹>及其衍生作品中的角色,曾化名云芝.加 ...

  8. origin python控制台怎么用_python如何使用代码运行助手

    python代码运行助手是能在网页上运行python语言的工具.因为python的运行环境在很多教程里都是用dos的,黑乎乎的界面看的有点简陋,所以出了这python代码运行助手,作为ide. 实际上 ...

  9. 爬虫案例:利用python爬虫关键词批量下载高清大图

    环境: python3+pycharm+requests+re+BeatifulSoup+json 这个确实也属实有一些勉强,不少童鞋私信问我有木有 下载大图 的源码,我说可能会有,现在分享给大家. ...

最新文章

  1. 2016 linux发行版排行_Linux发行版排行榜榜首:MX 19.1操作系统自有它不凡的魅力...
  2. 《CLR Via C# 第3版》笔记之(十四) - 泛型高级
  3. 黯然微信小程序杂记(一):从服务器获取数据 后端语言php
  4. java触发full gc的几种情况概述
  5. 【VLC-Android】LibVLC API简介(相当于VLC的MediaPlayer)
  6. echarts中的世界地图
  7. 【AI-1000问】为什么LeNet5倒数第二个全连接层维度为84?
  8. mysql数据库主从配置
  9. 分布式系统部署、监控与进程管理的几重境界
  10. 【2017年第2期】社交网络分析在公共安全领域的应用
  11. JAVA 正则表达式 RegexUtil
  12. ORACLE常用函数汇总【转】
  13. IE9或以上的浏览器flash值为空时,导致domready不触发
  14. 短视频直播带货APP源码 全开源原生直播APP源码
  15. java Google图片验证码_使用google.kaptcha来生成图片验证码的实现方法
  16. 精益软件研发的秘密 IT大咖说 - 大咖干货,不再错过
  17. 微信指纹java.lang_微信小程序调用指纹验证
  18. 怎么给QT工程ui添加图片
  19. 光量子计算机的功能,光量子计算机有什么用
  20. 华丽介绍夏日冰点------この青空に約束を

热门文章

  1. linux虚拟机lvm扩容,LVM扩容-----给虚拟机添加空间
  2. php b+树,PHP利用b+树概念实现树形数组
  3. mysql left join第一个_MySQL 之 LEFT JOIN 避坑指南
  4. 数据 3 分钟 | 余承东正式发布GaussDB(for openGauss)、浪潮宣布云溪数据库ZNBase开源...
  5. 进入云原生、分布式的时代,什么才是数据库的正确打开方式
  6. 新基建时代,腾讯云数据库沿主赛道加速演进
  7. Oracle DG常用视图与运维护常用操作
  8. 搭建亿级时间线数据的监控系统,我有绝招!
  9. 从架构设计理念到集群部署,全面认识KubeEdge
  10. 补习系列(18)-springboot H2 迷你数据库