python(BeautifulSoup爬)下载必应美图
看到必应美图没有水印了,就想着可以拿来做壁纸了,(早想这么干了)python也是现学现用的,写得很烂,只求能用程度
用python的BeautifulSoup爬出来链接,再用urllib下载文件
import urllib.request
import urllib3
import os
from bs4 import BeautifulSoup#下载进度显示
def Schedule(a,b,c):per = 100.0 * a * b / cif per > 100.0 :print('success')
#获取网页流
URL='http://cn.bing.com'
http=urllib3.PoolManager()
bing=http.request('GET',URL)
#解析出文件地址
soup=BeautifulSoup(bing.data,"html.parser")
imgbg=soup.select('#bgImg')[0]
fileULR=URL+imgbg.get('src')
fileName=fileULR.split('/')[-1]
#开始下载文件
urllib.request.urlretrieve(fileULR,'../Pictures/Wallpaper/'+fileName,Schedule)
#保存url到日志文件
open('./url.txt','a',encoding='utf-8').write(fileULR+'\n')
2019.1.23更新(原标签节点已消失,更新其他标签节点)
import urllib.request
import urllib3
import os
from bs4 import BeautifulSoupdef Schedule(a,b,c):per = 100.0 * a * b / cif per > 100.0 :print('success')URL='http://cn.bing.com'
http=urllib3.PoolManager()
bing=http.request('GET',URL)
soup=BeautifulSoup(bing.data,"html.parser")
imgbg=soup.select('#bgLink')[0]
fileULR=URL+imgbg.get('href')
fileName=fileULR.split('/')[-1]
urllib.request.urlretrieve(fileULR,'C:/Users/Hyz/OneDrive/Wallpaper/'+fileName,Schedule)
open('./url.txt','a',encoding='utf-8').write(fileULR+'\n')
2019.1.28更新,多加国际版搜索壁纸
import urllib.request
import urllib3
import os
from bs4 import BeautifulSoup#忽略证书验证
urllib3.disable_warnings()
def Schedule(a,b,c):per = 100.0 * a * b / cif per > 100.0 :print('100% success')else:sys.stdout.write(str(format(per,".1f"))+'%\r')#占行数字进度效果sys.stdout.flush()URL='http://cn.bing.com'
def bingImg(url):http=urllib3.PoolManager()bing=http.request('GET',url)soup=BeautifulSoup(bing.data,"html.parser")imgbg=soup.select('#bgLink')[0]fileULR=URL+imgbg.get('href')fileName=fileULR.split('/')[-1]urllib.request.urlretrieve(fileULR,'C:/Users/Hyz/OneDrive/Wallpaper/'+fileName,Schedule)open('./url.txt','a',encoding='utf-8').write(fileULR+'\n')
bingImg(URL)
bingImg('https://cn.bing.com/?FORM=BEHPTB&ensearch=1')
2019.3.10更新
import urllib3
import os
import sys
from urllib import request,parse
from bs4 import BeautifulSoup#忽略证书验证
urllib3.disable_warnings()
def Schedule(a,b,c):per = 100.0 * a * b / cif per > 100.0 :print('100% success')else:sys.stdout.write(str(format(per,".1f"))+'%\r')#占行数字进度效果sys.stdout.flush()URL='http://cn.bing.com'
def bingImg(url):http=urllib3.PoolManager()bing=http.request('GET',url)soup=BeautifulSoup(bing.data,"html.parser")imgbg=soup.select('#bgLink')[0]fileULR=URL+imgbg.get('href')#解析URL参数得出文件名fileName="".join(parse.parse_qs(parse.urlparse(fileULR).query)['id'])request.urlretrieve(fileULR,'C:/Users/Hyz/OneDrive/Wallpaper/'+fileName,Schedule)open('./url.txt','a',encoding='utf-8').write(fileULR+'\n')
bingImg(URL)
#bingImg('https://cn.bing.com/?FORM=BEHPTB&ensearch=1')
python(BeautifulSoup爬)下载必应美图相关推荐
- java 自动下载自动搜索_必应美图下载 - 自动更换批量下载的壁纸
必应( Bing )搜索 每天 都会在 搜索界面 内更换 非常好看 的 背景图片,因此有不少网友将这些 图片 下载下来设置成 桌面壁纸 使用.同时,也有不少 站长 在自己的 网站 上通过 接口 将自己 ...
- Python beautifulsoup爬取小说
Python beautifulsoup爬取小说 提前准备好需要的库文件,命令行输入以下命令 pip install requests pip install bs4 pip install lxml ...
- python爬虫爬取必应每日高清壁纸
python爬虫爬取必应每日高清壁纸 一.简介 二.使用的环境 三.网页分析 1.分析网页每一页url形式以及总页数 2.网页重要信息收集 3.在源码中寻找所需信息的位置 四.代码实现 五.运行爬虫 ...
- 【kimol君的无聊小发明】—用python写论文下载器(图形化界面)
[kimol君的无聊小发明]-用python写论文下载器(图形化界面) 前言 一.使用说明 二.代码分析 1. 功能函数 2. 回调函数 3. 线程生成函数 4. 效果展示 写在最后 前言 某个夜深人 ...
- php获取必应,php获取必应美图api
微软必应美图(http://bing.plmeizi.com/)上的每日一图十分好看,用来做壁纸.背景等,最好不过了. 那么,如何将网站或博客背景设成每天更新的必应美图呢? 本文将介绍两种方法,一种是 ...
- python画美图_用python做个街拍美图手册
今天分享一篇在家就能养眼的技能,用python爬取街拍美女高清大图,然后批量插入word中,制作街拍美图手册,闲的时候就能拿出来养养眼.本文涉及知识主要包括Ajax动态加载网页爬取.requests保 ...
- 教你用python做个街拍美图手册
今天分享一篇在家就能养眼的技能,用python爬取街拍美女高清大图,然后批量插入word中,制作街拍美图手册,闲的时候就能拿出来养养眼. 本文涉及知识主要包括Ajax动态加载网页爬取.requests ...
- 自学Python九 爬虫实战二(美图福利)
作为一个新世纪有思想有文化有道德时刻准备着的屌丝男青年,在现在这样一个社会中,心疼我大慢播抵制大百度的前提下,没事儿上上网逛逛YY看看斗鱼翻翻美女图片那是必不可少的,可是美图虽多翻页费劲!今天我们就搞 ...
- python BeautifulSoup爬取豆瓣电影top250信息并写入Excel表格
豆瓣是一个社区网站,创立于2005年3月6日.该网站以书影音起家,提供关于书籍,电影,音乐等作品信息,其描述和评论都是由用户提供的,是Web2.0网站中具有特色的一个网站. 豆瓣电影top250网址: ...
最新文章
- c语言符号txt下载,c语言中符号含义.txt
- 为什么单片机通常只有那么小的数据内存?
- NCL 小图对其问题
- vsphere vcenter安装
- linux下获取系统时间的方法
- CM: Create BAdI implementation for Webservice enabled word document
- html中显示shell脚本的输出,网页从shell脚本中输入并显示结果
- Java基础入门笔记-随机数
- Java记录 -73- 泛型详解
- css 根据不同屏幕设置间距_18-CSS问题-让多个div横排显示并设置间距解决方案
- TensorFlow:卷积神经网络
- 安卓电子市场_关于安卓手机发展史你知道多少?原来最早安卓居然不是手机系统!...
- (4)Matplotlib_零碎知识点
- 【Beta】Scrum Meeting 3
- 模拟鼠标移动、点击,双击,键盘输入,鼠标滚轮滚动
- “爱装X”开源组织:“教科书级”AI知识树究竟长什么样?
- 存储区域网络(SAN)概念和设计基础
- 无人车之美——技术要点速览
- 阿里云短信通道被人恶意刷了几万条短信,怎么办?(短信接口被盗刷系列3)
- 劝学诗整理:安居不用架高堂,书中自有黄金屋。
热门文章
- 智慧交通大数据融合平台建设方案
- 云客Drupal源码分析之网络攻击与防御措施
- 原来,阿里工程师才是隐藏的“修图高手”!
- 计算机电源 方案,PC电源功率如何确定? 电源选择的终极方案来了~
- SAP S4 HANA信贷管理之信贷未清表
- 问题导向VS目标导向:领导者要倾向哪种?
- 机器如何识别花的种类
- Python 自动化办公(一)
- Exception encountered during context initialization - cancelling refresh attempt: org.springframewor
- 软件卸载时遇到trying to use is on a network resource that is unavailable