一、什么是Sitemap?
Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。
百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好地对网站进行抓取。此外,Sitemap 与搜索排名没有关系。 
二、百度Sitemap协议都支持哪些格式?
百度Sitemap协议支持三种格式:文本格式、xml格式、Sitemap索引格式,可以根据自己情况来选择任意一种格式组织sitemap。   
具体格式说明及示例如下: 
1.第一种格式样例:txt文本格式
在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过站长平台进行提交,此文本文件需要遵循以下指南:文本文件每行都必须有一个网址。网址中不能有换行。不应包含网址列表以外的任何信息。您必须书写完整的网址,包括 http。每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
文本文件需使用 UTF-8 编码或GBK编码。2.第二种格式样例:xml格式您先了解单个xml数据格式如下:
<?xml  version="1.0" encoding="utf-8"?>
XML文件需以utf-8编码
<urlset>
必填,这是整个链接集合的定义入口,以<urlset>作为开始,</urlset>作为结束
<url>
必填,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面。
<loc> www.seelost.com </loc> ;
必填,页面链接地址,长度不得超过256字节。
<lastmod>2009-12-14</lastmod>
选填,用来指定该链接的最后更新时间
<changefreq>daily</changefreq>
选填,用这个标签告诉此链接可能会出现的更新频率
<priority>0.8</priority>
选填,可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间
</url>        必填,标签闭合
</urlset>
必填,标签闭合
上述xml sitemap向百度提交了一个url;
若有多条url,按照上述格式重复<url></url>之间的片断,列明所有url地址,打包到一个xml文件,向站长平台进行提交。
3.第三种格式样例:Sitemap索引格式
如需提交大量sitemap文件,则可将其列在sitemap索引文件中,然后将该索引文件提交。您无需分别提交每个文件。
<?xml version="1.0"  encoding="UTF-8" ?> 
XML文件需以utf-8编码
<sitemapindex>
必填,以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束
<sitemap>
必填,以<sitemap>标签提交一个子sitemap文件
<loc> </loc>;  ;        必填,识别sitemap的位置
<lastmod>2012-01-06</lastmod>
选填,识别相对sitemap文件的修改时间
</sitemap>
必填,标签闭合
</sitemapindex>
必填,标签闭合
有多个sitemap,按上述格式重复<sitemap></sitemap>之间的片断,列明所有sitemap地址,向站长平台进行提交。
三、创建sitemap时有哪些注意事项?
一个sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的sitemap超过了这些限值,请将其拆分为几个小的sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。
一次性最多提交50个地址,提交地址的文件类型和更新周期必须一致。如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。如果验证,你只能提交该验证网站的网址,不能出现其他网站的网址。
四、如何提交sitemap?
第一步,将需提交的网页列表制作成一个sitemap文件,文件格式请阅读百度sitemap协议都支持哪些格式。
第二步,将sitemap文件放置在网站目录下。
比如您的网站为example.com,您已制作了一个sitemap_example.xml的sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml
第三步,登录百度站长平台,确保提交sitemap数据的网站已验证归属。
第四步,进入sitemap工具,点击“添加新数据”,文件类型选择“URL列表”,填写抓取周期和sitemap文件地址,进行提交。
提交完之后,可在sitemap列表里看到提交的sitemap文件,如果sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。
整体流程如下图: 
五、我提交时填写的周期是什么含义?
百度spider会参考设置周期抓取sitemap文件,因此请根据sitemap文件内容的更新(比如增加新url)来设置。
请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不在此更新范围内。sitemap工具不能解决页面更新问题。
六、sitemap提交后,多久能被百度处理?
sitemap数据提交后,一般在1小时内百度会开始处理。处理完成的时间视文件大小和您设置的抓取周期而定。
七、提交的sitemap都会被百度抓取并收录吗?
百度对已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。

八、我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?
可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 应该小于 10MB(10,485,759字节)。

九、XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?
不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。

十、网址在 Sitemap 中的位置是否会影响它的使用?
不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。
十一、Sitemap中提交的url能否包含中文?
因为转码问题建议最好不要包含中文。

Sitemap工具解析相关推荐

  1. jq输出文本_如何用 Linux 命令行工具解析和格式化输出 JSON | Linux 中国

    我们将使用 Linux 上的命令行工具解析并格式化打印 JSON.它对于在 shell 脚本中处理大型 JSON 数据或在 shell 脚本中处理 JSON 数据非常有用.-- Ostechnix J ...

  2. mysql数据库迁徙_Mysql数据迁徙方法工具解析

    这篇文章主要介绍了mysql数据迁徙方法工具解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 数据迁徙是每个后端都会遇到的工作之一,本文介绍了一些 ...

  3. 谷歌浏览器开发者工具解析

    谷歌浏览器开发者工具解析 Elements 用于查看和编辑当前页面中的 HTML 和 CSS 元素. Console 用于显示脚本中所输出的调试信息,或运行测试脚本等. Sourses 用于查看和调试 ...

  4. 在线URL转sitemap工具

    在线URL转sitemap工具 本工具可以可以将URL列表转成google和百度支持的xml格式网站地图文件 在线URL转sitemap工具 https://tooltt.com/url2sitema ...

  5. New UI-Hierarchy Viewer工具解析app的界面布局

    New UI-Hierarchy Viewer工具解析app的界面布局  --转载请注明出处:coder-pig,欢迎转载,请勿用于商业用途! 小猪Android开发交流群已建立,欢迎大家加入,无论是 ...

  6. crash工具解析_Android Crash 工具

    crash工具解析_Android Crash 工具_weixin_39543655的博客-CSDN博客本篇文章主要介绍Android开发中的部分知识点,通过阅读本篇文章,您将收获以下内容:一.Cra ...

  7. 玩机搞机----修改手机各项参数工具解析 过验证 变新机

    任何的芯片原则上都可以修改当前机型的任何参数.包括但不限于高通 MTk 展讯..... 等其他芯片.众所周知,有的机型 有的版本可以直接修改,有的不行.至于具体原因可以参考我以往的帖子 安卓玩机搞机技 ...

  8. Vue 项目 build 流程解析(webpack工具解析)

    Vue 项目 build 流程解析(webpack工具解析) 注:本篇文章解析框架为 vue2.0 本篇文章通过解析简单的项目打包步骤试着去了解我们的 Vue 项目是怎么打包的. build.js 干 ...

  9. linux服务器返回json,Linux 命令行工具解析和格式化输出 JSON的方法

    JSON 是一种轻量级且与语言无关的数据存储格式,易于与大多数编程语言集成,也易于人类理解 -- 当然,如果格式正确的话.JSON 这个词代表 J ava S cript O bject N otat ...

最新文章

  1. 每日一套codeforce集训1119E[贪心],821C[栈模拟],645D[拓扑排序]
  2. PhpStorm升级后调用某些类提示phpstorm Unhandled exceptions
  3. pdf 天线理论与技术 钟顺时_虚拟仿真技术 | 基于HFSS仿真软件的微波天线课程教学探索...
  4. 关于button按钮在IE中的宽度问题、、、、
  5. ThinkPHP公共配置文件与各自项目中配置文件组合的方法
  6. java操作mongodb_Java操作MongoDB
  7. 中科院动物所团队揭示了空间种子传播集合网络的结构及功能维持机制
  8. html template--(来自网易)
  9. 腾讯电脑管家离线安装包_这个良心小工具,让你电脑流畅1倍,干掉流氓软件...
  10. Android开发笔记(一百七十九)避免方法数过多的问题
  11. 惠普企业级服务器型号,惠普企业级服务器HP rx8640
  12. plecs / plexim 学习随笔
  13. 敌兵布阵 HDU - 1166
  14. 电脑计算机显示向程序发送命令时出现问题,word提示向程序发送命令时出现问题怎么解决 wo...
  15. 智能管家---4.Log封装
  16. Unity 对话气泡
  17. TI达芬奇系列TMS320DM8168浮点DSP C674x + ARM Cortex-A8高性能视频处理器,用于视频基础设施
  18. 为云服务器(VPS)增加一个站点支持
  19. Finalshell反复提示输入密码
  20. 【网络编程】Linux tcpdump命令详解---编辑中

热门文章

  1. java头像_用java实现给你的头像) +n
  2. Kali Linux 更新系统 2020.3
  3. html单选框选中状态,jquery如何判断单选框是否被选中?
  4. Apache Calcite官方文档中文版- 概览-2. 教程
  5. 亮度温度(Brightness Temperatures)
  6. html的图片滤镜效果,使用 CSS 实现图片的滤镜效果
  7. yolov3实现之基本处理单元
  8. 从串口驱动到Linux驱动模型
  9. Android:SpannableString使用详解
  10. 为什么你的简历没人看?7份案例分析(收藏)