python 爬取百度日历
导入依赖
import requests
import json
import random
生成随机数
dataTime = str(random.random())
从百度的php接口中获取到数据
def catch_url_from_baidu(calcultaion_year, month):header = {"Content-Type": "application/json;charset=UTF-8"}param = {"query": calcultaion_year + "年" + month + "月","resource_id": "39043","t": dataTime,"ie": "utf8","oe": "gbk","format": "json","tn": "wisetpl","cb": ""}# 抓取位置:百度搜索框搜索日历,上面的日历的接口,可以在页面上进行核对r = requests.get(url="https://sp0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php",headers=header, params=param).textmonth_data = json.loads(r)["data"][0]["almanac"]work_day = []for one in month_data:if (one["cnDay"] != '日' and one["cnDay"] != '六'and ('status' not in one)):work_day.append(one)print(work_day)
完整代码
import requests
import json
import randomdataTime = str(random.random())
# 从百度的php接口中获取到数据
def catch_url_from_baidu(calcultaion_year, month):header = {"Content-Type": "application/json;charset=UTF-8"}param = {"query": calcultaion_year + "年" + month + "月","resource_id": "39043","t": dataTime,"ie": "utf8","oe": "gbk","format": "json","tn": "wisetpl","cb": ""}# 抓取位置:百度搜索框搜索日历,上面的日历的接口,可以在页面上进行核对r = requests.get(url="https://sp0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php",headers=header, params=param).textmonth_data = json.loads(r)["data"][0]["almanac"]work_day = []for one in month_data:if (one["cnDay"] != '日' and one["cnDay"] != '六'and ('status' not in one)):work_day.append(one)print(work_day)if __name__ == '__main__':# 此处只能算当年之前的,因为国务院是每年12月份才会发布第二年的放假计划,所以此接口对于下一年的统计是错的。calcultaion_year = "2022"# 因该接口传入的时间,查询了前一个月,当前月和后一个月的数据,所以只需要2、5、8、11即可全部获取到。比如查询5月份,则会查询4,5,6月分的数据calculation_month = ["2", "5", "8", "11"]for one_month in calculation_month:catch_url_from_baidu(calcultaion_year, one_month)
python 爬取百度日历相关推荐
- python爬百度翻译-Python爬取百度翻译(利用json提取数据)
本篇文章给大家带来的内容是关于Python爬取百度翻译(利用json提取数据),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 工具:Python 3.6.5.PyCharm开发工具. ...
- python爬取百度使用kw关键字爬取时出现,百度安全验证,解决方法
python爬取百度使用kw关键字爬取时出现,百度安全验证,解决方法 之前爬取百度用kw时的代码(没有任何问题) import requestsurl = 'http://www.baidu.com/ ...
- python爬取百度贴吧图片库_python爬取百度贴吧的图片2
今天看了一下beautifulsoup库的用法,把昨天的python爬取百度贴吧的图片1的代码更新成使用beautifulsoup库的函数来实现.用的还是不太熟练,但是感觉比正则表达式写起来容易了一些 ...
- python爬取百度搜索_使用Python + requests爬取百度搜索页面
想学一下怎样用python爬取百度搜索页面,因为是第一次接触爬虫,遇到一些问题,把解决过程与大家分享一下 1.使用requests爬取网页 首先爬取百度主页www.baidu.com import r ...
- Python爬取百度翻译及有道翻译
Python爬取百度翻译及网易有道翻译 百度翻译 一.简介 明确翻译链接,百度翻译链接:https://fanyi.baidu.com/,但是该链接不能为我们提供翻译的内容,此时需要在chrome浏览 ...
- 【Python】python爬取百度云网盘资源-源码
今天测试用了一下python爬取百度云网盘资源. 标签: <无> 代码片段 [代码][Python]代码 import urllib import urllib.request impor ...
- python爬取百度在线语音合成的音频
python爬取百度在线语音合成 URL:https://ai.baidu.com/tech/speech/tts_online 抓包 api从这里抓包,用的post请求,返回的是base64文件格式 ...
- python爬取百度云网盘资源-源码
今天测试用了一下python爬取百度云网盘资源. 代码片段 import urllib import urllib.request import webbrowser import re def yu ...
- Python爬取百度图库
Python爬取百度图库 页面分析 通过Chrome 的开发者模式,我们可以很发现 百度图库是通过ajax 加载图片的. 每一次都会发送一个请求:https://image.baidu.com/sea ...
- python爬取百度贴吧
利用python爬取百度贴吧的网页,输入贴吧名,起始页,终止页,爬取索要爬取的页面 贴吧 ''' import urllib.request import urllib.parse import ti ...
最新文章
- 2022年全球及中国集电环行业发展格局与十四五供需现状分析报告
- -bash:XXX: command not found报错(云服务centos)
- centos7源代码安装mysql5.7_CentOS7源码编译安装MySQL5.7.11
- 中求和符号上下标_涨电脑知识:如何在word中编写复杂的公式,写论文必备技能...
- 蓝桥杯 算法提高 日期计算
- 解决github拉项目慢的问题
- 计算机课的实训小结,课程实训心得体会与小结三篇
- 中国移动短信MISC割接
- 计算机系统字体推荐,10大最合适编程的字体推荐
- win11系统下,迅雷启动后闪退的问题
- 财务会计 -- 什么是借贷
- [PHP]PHP爬虫 - URP教务
- 阿卜杜拉国王科技大学的计算机,阿卜杜拉国王科技大学,沙特国王大学开设专业。...
- 宝宝 天天加班, 有意义吗
- android 锁屏音乐控制
- 2015-12-12 java hibernate 微信表情昵称保存
- java复制sheet_java-poi 复制Sheet到另一个excel的sheet中
- 非全日制做JAVA,全日制与非全日制详解
- python 读取多级表头_python之Dataframe:多级表头和索引灵活的处理(一)
- Linux实现自动挂载光盘
热门文章
- 毕业设计之---基于java web的停车管理系统
- CorelDRAW X4无法响应卡死解决方法教程
- 量子化学计算机程序,量子化学
- python roberts滤波_Python 图像处理 OpenCV (12): Roberts 算子、 Prewitt 算子、 Sobel 算子和 Laplacian 算子边缘检测技术...
- 闪电html编辑器,闪电pdf编辑器
- AllenNLP 用法总结
- 【AllenNLP】: 自定义predictor—输入文本输出中文
- opencv——convertTo
- 最速下降法python_python实现最速下降法
- matlab做聚类分析(简单的直接用clusterdata)