目录

  • 需求
  • 网站分析
  • 代码实现
  • 进一步
  • 通过接口获取
  • 定时获取
  • 页面展示
  • 其他参考资源

需求

老板:微软必应https://cn.bing.com/ 首页的每日一图看着不错,能不能自动获取

我:我试试

网站分析

我们查看网页元素,不难发现背景图就在类名为.img_cont 的标签下

可是搜索源代码 view-source:https://cn.bing.com/

<div class="img_cont" style="background-image: url(https://s.cn.bing.net/th?id=OHR.BrockenSpecter_ZH-CN5278743909_1920x1080.jpg&amp;rf=LaDigue_1920x1080.jpg); opacity: 1;">

发现style属性中的数据不能直接获取,需要使用到正则提取url

换个方法,试试搜索图片地址:

https://s.cn.bing.net/th?id=OHR.BrockenSpecter_ZH-CN5278743909_1920x1080.jpg

发现有三个地方

第一处是在header中

<link rel="preload" href="https://s.cn.bing.net/th?id=OHR.BrockenSpecter_ZH-CN5278743909_1920x1080.jpg&amp;rf=LaDigue_1920x1080.jpg&amp;qlt=50" as="image" id="preloadBg" />

第二处在类名为img_cont 的标签中

<div class="img_cont" style="background-image: url(https://s.cn.bing.net/th?id=OHR.BrockenSpecter_ZH-CN5278743909_1920x1080.jpg&amp;rf=LaDigue_1920x1080.jpg); opacity: 1;">

第三处在js代码中

"Image":{"Url":"https://s.cn.bing.net/th?id=OHR.BrockenSpecter_ZH-CN5278743909_1920x1080.jpg\u0026rf=LaDigue_1920x1080.jpg",

代码实现

通过以上分析,我们可以发现,通过id="preloadBg"的元素获取比较方便

此处需要加一个请求头,避免获取不到正常的网页源代码

安装依赖

$ python --version
Python 3.6.5$ pip install parsel requests

代码示例

# -*- coding: utf-8 -*-
"""
@File    : demo.py
@Date    : 2022-10-26
@Author  : Peng Shiyu
"""import parsel
import requestsdef get_bing_image():url = 'https://cn.bing.com'headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36'}res = requests.get(url, headers=headers)res.encoding = res.apparent_encodingsel = parsel.Selector(res.text, base_url=url)return sel.css('#preloadBg::attr(href)').extract_first()if __name__ == '__main__':image_url = get_bing_image()print(image_url)
#     https://s.cn.bing.net/th?id=OHR.BrockenSpecter_ZH-CN5278743909_1920x1080.jpg&rf=LaDigue_1920x1080.jpg&qlt=50

进一步

我们发现,图片还有一些介绍信息,我们看看能不能拿到


再次查看源码,我们可以发现,网页中有一个js的变量,包含了页面中壁纸的信息

// 截取部分代码
var _model ={"Headline":"山上的幽灵","Title":"巴尔干中央国家公园的布罗肯现象,保加利亚"}

我们可以通过re正则表达式解析这个json字符串,获取更多的数据

# -*- coding: utf-8 -*-
"""
@File    : demo.py
@Date    : 2022-10-26
@Author  : Peng Shiyu
"""
import json
import reimport requestsdef get_bing_image():url = 'https://cn.bing.com'headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36'}res = requests.get(url, headers=headers)res.encoding = res.apparent_encodingret = re.search("var _model =(\{.*?\});", res.text)if not ret:returndata = json.loads(ret.group(1))image_content = data['MediaContents'][0]['ImageContent']return {'headline': image_content['Headline'],'title': image_content['Title'],'description': image_content['Description'],'image_url': image_content['Image']['Url'],'main_text': image_content['QuickFact']['MainText']}if __name__ == '__main__':res = get_bing_image()print(json.dumps(res, ensure_ascii=False, indent=2))

输出

{"headline": "山上的幽灵","title": "巴尔干中央国家公园的布罗肯现象,保加利亚","description": "万圣节快到了,今天的照片也非常应景,展示了一只“幽灵”,也就是布罗肯现象。尽管看着灵异,但布罗肯现象并非超自然现象。这是一位观察者被投射在阳光对面云层上的阴影。布罗肯现象很少见,但如果你在黎明时分爬上薄雾弥漫的山坡,则有可能幸运地目睹这种现象。只要满足条件,布罗肯现象可以出现在任何地方。在德国哈尔茨山脉的布罗肯峰,当地传说浓雾弥漫的山间有幽灵出没。1780年,约翰·西尔伯施拉格在此观察到了“幽灵”,对其进行了描述记录,并将其命名为“布罗肯现象”。此后,布罗肯现象便常常被记录在有关该地区的文献之中。","image_url": "https://s.cn.bing.net/th?id=OHR.BrockenSpecter_ZH-CN5278743909_1920x1080.jpg&rf=LaDigue_1920x1080.jpg","main_text": "布罗肯现象出现在日出与日落时的高山上,当前面弥漫着雾气时,太阳光将人的背影衍射在雾气上,浮现出彩虹轮廓。"
}

通过接口获取

当然,我们也不必那么麻烦,bing已经贴心的给大家提供了一个接口,可以直接使用。

只不过接口中返回的介绍性文字没有直接从页面上获取的多。

接口地址:

https://cn.bing.com/HPImageArchive.aspx?format=js&idx=0&n=1&mkt=zh-CN

参数

参数 含义
format 返回数据形式 js - json xml - xml
idx 截止天数 0-今天 -1 - 截止至明天 1 截止至昨天
n 返回数量
mkt 地区 zh-CN - 国区

接口来源 Python - 定时自动获取 Bing 首页壁纸

返回数据

{"images": [{"startdate": "20221027","fullstartdate": "202210271600","enddate": "20221028","url": "/th?id=OHR.FrankensteinFriday_ZH-CN5814917673_1920x1080.jpg&rf=LaDigue_1920x1080.jpg&pid=hp","urlbase": "/th?id=OHR.FrankensteinFriday_ZH-CN5814917673","copyright": "洛桑日内瓦湖上空的暴风雨,瑞典 (© Suradech Singhanat/Shutterstock)","copyrightlink": "https://www.bing.com/search?q=%E6%97%A5%E5%86%85%E7%93%A6%E6%B9%96&form=hpcapt&mkt=zh-cn","title": "一个黑暗的暴风雨之夜","quiz": "/search?q=Bing+homepage+quiz&filters=WQOskey:%22HPQuiz_20221027_FrankensteinFriday%22&FORM=HPQUIZ","wp": true,"hsh": "426b0dd10360d364a0fcab233d04a9e3","drk": 1,"top": 1,"bot": 1,"hs": []}],"tooltips": {"loading": "正在加载...","previous": "上一个图像","next": "下一个图像","walle": "此图片不能下载用作壁纸。","walls": "下载今日美图。仅限用作桌面壁纸。"}
}

定时获取

我们没有服务器,没有数据库的情况下,怎么才能获取每日最新的图呢?总不能每天自己手动执行吧,肯定不行。

于是。我们可以利用Github Actions 每天执行定时任务,每天定时自动获取数据

数据获取项目地址:https://github.com/mouday/wallpaper-database

页面展示

不能每次都查看数据,我们需要一个直观的显示地址,所以可以用Vue.js制作一个简单的预览地址,将我们获取的数据展示到浏览器。

数据展示项目地址:https://github.com/mouday/wallpaper

预览地址(仅供学习使用):https://mouday.github.io/wallpaper/

其他参考资源

有小伙伴已经做了必应壁纸图片网站

https://bing.ioliu.cn/

https://www.todaybing.com/

https://www.bingimg.cn/

Python实战:获取bing必应壁纸首页的每日一图(仅做学习用)相关推荐

  1. 接口的方式获取bing必应每天壁纸

    接口的方式获取bing必应每天壁纸 获取图片接口,返回json 请求接口 idx:起始位置 n:偏移量 http://www.bing.com/HPImageArchive.aspx?format=j ...

  2. python中利用turtle(海龟)绘图制作龟兔赛跑动画——仅供学习

    python中利用turtle(海龟)绘图制作龟兔赛跑动画--仅供学习哦 首先,欢迎大家来我的博客当中浏览,由于我和我的可爱现在还都个初学者,所作的东西还不够完善,之前在学习计算机的各种语言的过程中, ...

  3. bing必应壁纸下载器

    自己写的一个简单的必应壁纸获取工具,可以自动获取必应壁纸并设置为桌面. 界面如图 下载地址 https://wjk.lanzous.com/ibf8xyb

  4. Win7首个动态主题 可自动获取Bing新壁纸

    微软之前曾提供了很多Windows 7主题包,其中就包括多个Bing主题包,但是此次微软提供了一个独特的Bing动态主题包,之所以称其为动态主题包是因为它可以连接至网络并从全球用户的Windows桌面 ...

  5. 很好用的壁纸网站源码分享,仅供学习,请勿商用。

    分享一个壁纸网站源码,无需安装,修改之后就可很好使用. 集合360壁纸,百度壁纸,必应壁纸,简单好用. 演示地址:http://www.toqia.com/bizhi/ 好用的话,记得点赞哦. 百度网 ...

  6. Python + Selenium + Chrome Driver 自动化点击+评论+刷弹幕(仅供学习)

    Python + Selenium + Chrome Driver 自动化点击 评论 刷弹幕 首先说明,这篇博文仅供学习!仅供学习!仅供学习! 不要拿去做其他事,封号概不负责!!! 突发奇想 首先先说 ...

  7. Python实战-获取鼠标键盘事件

    这里主要使用的模块是pyhook.原理非常简单,在windows操作系统下的任何操作会被钩子钩住,当我的得到我想要的信息之后再将原来的消息发送出去,我截取了我想要的消息.这里推荐使用pyHook3,因 ...

  8. python壁纸数据抓取软件_python应用:Python 爬取必应壁纸

    Python是一种解释型脚本语言,可以应用于以下领域: web和Internet开发 科学计算和统计 人工智能 教育 桌面界面开发 软件开发 后端开发 网络爬虫 import re import os ...

  9. 每天定时获取必应每日一图并保存做壁纸

    每天定时获取必应每日一图并保存做壁纸 ​ 必应每天会更新每日一图,这些图片都是特别好看,适合做封面壁纸等等.我做了一个自动脚本,让它每天定时获取每日一图,然后设置为个人主页博客的封面,封面和背景一共九 ...

  10. Python爬虫实战——获取电影影评

    Python爬虫实战--获取电影影评 前言 第三方库的安装 示例代码 效果演示 结尾 前言 使用Python爬取指定电影的影评, 注意:本文仅用于学习交流,禁止用于盈利或侵权行为. 操作系统:wind ...

最新文章

  1. jmeter跨线程组传值
  2. python同时发大量请求_python http服务器,多个同时请求
  3. php 获取上周日期_php 获取今日、昨日、上周、本月的起始时间戳和结束时间
  4. C和指针之判断参数在关键字字符串列表中是否匹配
  5. Pyhton入门 笔记 第三天 正则表达式与JSON
  6. P1020 导弹拦截
  7. android开发学习——关于activity 和 fragment在toolbar上设置menu菜单
  8. WPF - 属性系统 (4 of 4)
  9. win7 虚拟机安装
  10. 软件工程课程实验报告:实验五
  11. 基于dsp28035之Simulink实验系列(1)-点亮第一盏灯
  12. 【一起学习输入法】华宇拼音输入法开源版本解析(5)
  13. 基于Zpl实现斑马打印机打印条码
  14. 轻量级私有云存储企业主要功能探析
  15. 加拿大卡尔顿大学暑课两个月入门Java全记录_1
  16. Android:使用Jetpack Compose画渐变背景
  17. c#编写activeX控件详细教程,底部附有下载地址
  18. 使用Qt实现计算器功能
  19. http://xing8s8.com/index.php,robot framework
  20. 项目管理中最常见的问题有哪些?

热门文章

  1. Python爬取天气数据及可视化分析!这是秋天该有的气温?
  2. MongoDB中balancer操作
  3. Telemetry原理
  4. 计算机怎么更换硬盘,如何更换电脑新硬盘无需重装系统_换硬盘不重装系统方法...
  5. NVIDIA Jetson TK1学习与开发——手动刷机
  6. java开发tv上转盘抽奖_java实现大转盘抽奖的简单思路
  7. 拼多多玩出花的社交电商 你知道多少?四川海昇智深度解析来啦
  8. 基于springboot网上商城交易平台源码
  9. vuejs出的手机app有哪些_vue.js点餐app手机触屏滑动分类菜单切换代码
  10. 计算机主机sn号怎么查看,笔记本序列号怎么看_笔记本电脑SN序列号的查看方法-win7之家...