根据sitemap一键推送给百度收录的python小脚本
欢迎关注原创视频教程
Python微信订餐小程序课程视频
https://edu.csdn.net/course/detail/36074
Python实战量化交易理财系统
https://edu.csdn.net/course/detail/35475
背景
之前我发表过一遍Python 5行代码实现主动推送链接给百度–实现快速收录,如果你的博客/网站管理系统支持发布回调的话是很方便使用的,但有很多站点使用的cms或博客管理系统无法实现调用的话,那就使用今天何三给大家分享的根据sitemap一键推送给百度收录的python小脚本吧
思路
- 获取站点的sitemap.xml
- 解析sitemap中的url链接地址
- 组合成数据并推送给百度
实施
1、获取站点的sitemap.xml
我们通过requests库获取
import requests
sitemap_url = 'https://www.h3blog.com/sitemap.xml' #sitemap.xml的链接地址
ret = requests.get(sitemap_url,timeout=3).text
print(ret) # 输出sitemap.xml内容
2、解析sitemap.xml中url链接地址
由于sitemap.xml是xml格式,那么我可以使用python中xml模块,也可以使用正则表达式,由于sitemap.xml比较简单用正则表达式比较方便
import re
re_loc = re.compile('<loc>(.*?)</loc>')
urls = re.findall(re_loc,ret)
print(urls) #输出解析出来的链接列表
3、组合成接口数据并推送给百度
百度资源平台接口如果有多个链接地址是需要用\n分割开的
urls_str = '\n'.join(urls) #组合数据,使用\n进行分割组合
result = baidu_push_urls('https://www.h3blog.com',urls_str) #调用百度接口
print(result)
完整代码:
import requests
import rebaidu_token = '你的token' #百度资源平台token#推送百度接口函数
def baidu_push_urls(domain,urls):headers = {'Content-Type':'text/plain'}url = 'http://data.zz.baidu.com/urls?site={}&token={}'.format(domain,baidu_token)ret = requests.post(url,headers=headers, data = urls, timeout=3).textreturn retdef push_sitemap(domain,sitemap_url):#获取sitemap.xml内容ret = requests.get(sitemap_url,timeout=3).text#解析sitemap.xml中的链接地址re_loc = re.compile('<loc>(.*?)</loc>')urls = re.findall(re_loc,ret)#组合数据并调用百度推送接口urls_str = '\n'.join(urls)result = baidu_push_urls(domain,urls_str)print(result) #打印结果if __name__ == '__main__':domain = 'https://www.h3blog.com' #修改成你自己的域名sitemap_url = 'https://www.h3blog.com/sitemap.xml' #修改成你网站的sitemap.xml地址push_sitemap(domain,sitemap_url)
将上述代码保存成push_sitemap.py 并将参数修改成你自己即可运行
{"remain":99937,"success":34}
返回参数详解请查看 [百度资源平台接口说明](
根据sitemap一键推送给百度收录的python小脚本相关推荐
- 百度主动推送,百度收录,百度sitemap.xml的标准格式...
如何选择链接提交方式 主动推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录. sitemap:您可以定期将网站链接放到Sitemap中,然后 ...
- Python 自动推送百度收录脚本
Python 自动推送百度收录脚本 版权属于:瞌学家 所有,转载请注明出处 本文链接:https://www.songonline.top/archives/185/ 友情提示: 如果文章部分链接出现 ...
- 站长必备-一键推送快速收录工具
什么是推送 网站建设完成后,首先向百度.搜狗.360.神马.谷歌.Bing等搜索引擎提交新网站.搜索引擎提交包括提交给搜索引擎爬虫类和分类目录.提交给搜索引擎爬虫类的目的是让搜索引擎将网站 ...
- 一键虚拟机关机/重启---远离重复---Shell小脚本
项目场景: 解决了每次虚拟机关机或重启都需要手动一个个关机或重启的烦恼! 问题描述: 每天的学习工作结束,当需要关闭虚拟机时,VMware的一键关机或者重启无法起作用,于是写了个小脚本实现改功能 解决 ...
- java调用百度推送详解_Java 以 Post 方式实现百度 Sitemap 实时推送
Sitemap 可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页.最简单的 Sitemap 形式,就是XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间.更改的 ...
- 提高百度收录:如何使用API提交之PHP推送功能(实操)
百度收录资源提交主要有3种方式: API推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录. Sitemap:您可以定期将网站链接放到Site ...
- 怎么使用php提交百度收录_百度站长平台链接自动提交PHP推送实现方式
百度站长平台最近改版,大家也是都知道的事情,关注最高的应该还是sitemap的权限以及链接的自动提交推送的改版,再改版前期百度站长平台进行了一段时间的sitemap的抽奖活动,呵呵抽到了几个站的权限. ...
- 利用百度主动推送(实时)API接口,使用Python批量提交网站链接到百度收录
网站建好了,但是为了让更多的人能够看到自己的网址的文章,还需要利用搜索引擎,搜索引擎对网站的收录量决定了网站的展现量.国内主要的搜索入口还是百度一家独大,另外还分流了部分流量的是360搜索和搜狗搜索, ...
- 织梦插件织梦CMS百度收录查询及批量推送未收录插件
织梦插件织梦CMS百度收录查询及批量推送未收录插件 织梦百度收录查询插件说明 1.支持gbk和utf8编码2种程序 2.支持分批查询收录情况,无畏大量文章数据 3.支持指定栏目查询收录情况 4.支持关 ...
最新文章
- 服务器可视化_系统管理员不可错过的6款服务器监控工具
- mysql用法之创建事件
- 【原创】PostgreSQL 增量备份详解以及相关示例
- 包钢集团、云南建投、南粤交通等大型国企选择用友BIP 实现财务数智能化
- Spring中Bean的配置方式之通过全类名(反射)
- cocos2d-x游戏实例(9)-A星算法(5)
- 一次完整的性能测试过程
- CodeIgniter配置之config
- 7-6 求整数段和 (10 分)
- 解决freebsd下root默认不能用ssh连接
- [转载] Python 字典删除元素clear、pop、popitem
- 线程池ThreadPoolExecutor里面4种拒绝策略
- Ubuntu18安装AWVS,然后在破姐次数限制,就问你能不能忍住不赞?
- 如何使用智遥工作流为SAP节省License实例
- windows 10 windows凭据管理器使用已记录的密码
- html上图片用js绘制点,用 js + html 描图 与画箭头
- 首发国产软硬件完美兼容STM32F407系列功能简介
- 使用git提交代码到仓库报错总结
- SpringMVC整合mybatis(终结版)
- Maven第3篇:详解maven解决依赖问题