欢迎关注原创视频教程

Python微信订餐小程序课程视频

https://edu.csdn.net/course/detail/36074

Python实战量化交易理财系统

https://edu.csdn.net/course/detail/35475

背景

之前我发表过一遍Python 5行代码实现主动推送链接给百度–实现快速收录,如果你的博客/网站管理系统支持发布回调的话是很方便使用的,但有很多站点使用的cms或博客管理系统无法实现调用的话,那就使用今天何三给大家分享的根据sitemap一键推送给百度收录的python小脚本吧

思路

  1. 获取站点的sitemap.xml
  2. 解析sitemap中的url链接地址
  3. 组合成数据并推送给百度

实施

1、获取站点的sitemap.xml

我们通过requests库获取

import requests
sitemap_url = 'https://www.h3blog.com/sitemap.xml'      #sitemap.xml的链接地址
ret = requests.get(sitemap_url,timeout=3).text
print(ret) #    输出sitemap.xml内容

2、解析sitemap.xml中url链接地址

由于sitemap.xml是xml格式,那么我可以使用python中xml模块,也可以使用正则表达式,由于sitemap.xml比较简单用正则表达式比较方便

import re
re_loc = re.compile('<loc>(.*?)</loc>')
urls = re.findall(re_loc,ret)
print(urls)     #输出解析出来的链接列表

3、组合成接口数据并推送给百度

百度资源平台接口如果有多个链接地址是需要用\n分割开的

urls_str = '\n'.join(urls)  #组合数据,使用\n进行分割组合
result = baidu_push_urls('https://www.h3blog.com',urls_str) #调用百度接口
print(result)

完整代码:

import requests
import rebaidu_token = '你的token' #百度资源平台token#推送百度接口函数
def baidu_push_urls(domain,urls):headers = {'Content-Type':'text/plain'}url = 'http://data.zz.baidu.com/urls?site={}&token={}'.format(domain,baidu_token)ret = requests.post(url,headers=headers, data = urls, timeout=3).textreturn retdef push_sitemap(domain,sitemap_url):#获取sitemap.xml内容ret = requests.get(sitemap_url,timeout=3).text#解析sitemap.xml中的链接地址re_loc = re.compile('<loc>(.*?)</loc>')urls = re.findall(re_loc,ret)#组合数据并调用百度推送接口urls_str = '\n'.join(urls)result = baidu_push_urls(domain,urls_str)print(result) #打印结果if __name__ == '__main__':domain = 'https://www.h3blog.com'   #修改成你自己的域名sitemap_url = 'https://www.h3blog.com/sitemap.xml'      #修改成你网站的sitemap.xml地址push_sitemap(domain,sitemap_url)

将上述代码保存成push_sitemap.py 并将参数修改成你自己即可运行

{"remain":99937,"success":34}

返回参数详解请查看 [百度资源平台接口说明](

根据sitemap一键推送给百度收录的python小脚本相关推荐

  1. 百度主动推送,百度收录,百度sitemap.xml的标准格式...

    如何选择链接提交方式 主动推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录. sitemap:您可以定期将网站链接放到Sitemap中,然后 ...

  2. Python 自动推送百度收录脚本

    Python 自动推送百度收录脚本 版权属于:瞌学家 所有,转载请注明出处 本文链接:https://www.songonline.top/archives/185/ 友情提示: 如果文章部分链接出现 ...

  3. 站长必备-一键推送快速收录工具

    什么是推送       网站建设完成后,首先向百度.搜狗.360.神马.谷歌.Bing等搜索引擎提交新网站.搜索引擎提交包括提交给搜索引擎爬虫类和分类目录.提交给搜索引擎爬虫类的目的是让搜索引擎将网站 ...

  4. 一键虚拟机关机/重启---远离重复---Shell小脚本

    项目场景: 解决了每次虚拟机关机或重启都需要手动一个个关机或重启的烦恼! 问题描述: 每天的学习工作结束,当需要关闭虚拟机时,VMware的一键关机或者重启无法起作用,于是写了个小脚本实现改功能 解决 ...

  5. java调用百度推送详解_Java 以 Post 方式实现百度 Sitemap 实时推送

    Sitemap 可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页.最简单的 Sitemap 形式,就是XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间.更改的 ...

  6. 提高百度收录:如何使用API提交之PHP推送功能(实操)

    百度收录资源提交主要有3种方式: API推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录. Sitemap:您可以定期将网站链接放到Site ...

  7. 怎么使用php提交百度收录_百度站长平台链接自动提交PHP推送实现方式

    百度站长平台最近改版,大家也是都知道的事情,关注最高的应该还是sitemap的权限以及链接的自动提交推送的改版,再改版前期百度站长平台进行了一段时间的sitemap的抽奖活动,呵呵抽到了几个站的权限. ...

  8. 利用百度主动推送(实时)API接口,使用Python批量提交网站链接到百度收录

    网站建好了,但是为了让更多的人能够看到自己的网址的文章,还需要利用搜索引擎,搜索引擎对网站的收录量决定了网站的展现量.国内主要的搜索入口还是百度一家独大,另外还分流了部分流量的是360搜索和搜狗搜索, ...

  9. 织梦插件织梦CMS百度收录查询及批量推送未收录插件

    织梦插件织梦CMS百度收录查询及批量推送未收录插件 织梦百度收录查询插件说明 1.支持gbk和utf8编码2种程序 2.支持分批查询收录情况,无畏大量文章数据 3.支持指定栏目查询收录情况 4.支持关 ...

最新文章

  1. 服务器可视化_系统管理员不可错过的6款服务器监控工具
  2. mysql用法之创建事件
  3. 【原创】PostgreSQL 增量备份详解以及相关示例
  4. 包钢集团、云南建投、南粤交通等大型国企选择用友BIP 实现财务数智能化
  5. Spring中Bean的配置方式之通过全类名(反射)
  6. cocos2d-x游戏实例(9)-A星算法(5)
  7. 一次完整的性能测试过程
  8. CodeIgniter配置之config
  9. 7-6 求整数段和 (10 分)
  10. 解决freebsd下root默认不能用ssh连接
  11. [转载] Python 字典删除元素clear、pop、popitem
  12. 线程池ThreadPoolExecutor里面4种拒绝策略
  13. Ubuntu18安装AWVS,然后在破姐次数限制,就问你能不能忍住不赞?
  14. 如何使用智遥工作流为SAP节省License实例
  15. windows 10 windows凭据管理器使用已记录的密码
  16. html上图片用js绘制点,用 js + html 描图 与画箭头
  17. 首发国产软硬件完美兼容STM32F407系列功能简介
  18. 使用git提交代码到仓库报错总结
  19. SpringMVC整合mybatis(终结版)
  20. Maven第3篇:详解maven解决依赖问题

热门文章

  1. vr多人_如何构建多人VR网络应用
  2. 詹姆斯高斯林_詹姆斯·高斯林(James Gosling)警告《银翼杀手》的未来
  3. 零输入响应,零状态响应和完全响应
  4. 【淘宝代运营】店铺运营实操中,需要掌握的五点
  5. solr 从数据库导入数据,全量索引和增量索引
  6. 【npm】npm发布测试(beta)版和正式版
  7. 掘金 AMA:听闲鱼客户端架构师--邬吉风聊 Flutter 和移动端开发那些事
  8. 2020-11-30
  9. android开发之应用Crash自动抓取Log_自动保存崩溃日志到本地
  10. windows10 飞秋不能发送文件 防火墙设置