Sitemap的介绍以及如何使用
Sitemap(站点地图)是一种文件,站长可通过该文件列出网站上的网页,将网站内容的组织结构告知搜索引擎。神马等搜索引擎网页抓取工具会读取此文件,以便更加智能地抓取网站内容
方法/步骤
Sitemap(站点地图)是一种文件,站长可通过该文件列出网站上的网页,将网站内容的组织结构告知搜索引擎。神马等搜索引擎网页抓取工具会读取此文件,以便更加智能地抓取网站内容
理想状况下,如果您的网站网页间关联得当,神马的网页抓取工具便能够发现其中的大多数网页。即便如此,提交站点地图仍有助于搜索引擎更加有效地抓取网站,尤其是当网站符合以下某个条件时:1.网站为新建网站且指向该网站的外部链接不多。搜索引擎的网页抓取工具通过跟踪网页之间的链接来抓取网页,如果没有其他网站链接到您的网页,可能不会发现您的网页。2.网站规模很大。 在这种情况下,神马的网页抓取工具可能会在抓取时漏掉部分新网页。3.网站中大量内容页之间互不关联或缺少有效链接。 如果您的网站网页没有自然地相互引用,那么您可以在站点地图中列出这些网页,以确保搜索引擎不会漏掉您的网页。
需要注意的是,神马搜索会按正常流程分析、处理Sitemap,但不保证一定会抓取及索引您提交的所有网址,不保证其在搜索结果中的排名。
Sitemap格式:
神马搜索支持的Sitemap文件包括标准xml文件和索引型xml文件。标准xml文件最多包含10,000条url,如果url超过10,000条可采用索引型xml文件,索引型xml限定最多不超过三层。
标准xml文件格式示例:
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<urlset>
<!--必填-->
<url>
<!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 -->
<loc>http://m.domain.com/abc.xhtml</loc>
<!--必填,URL长度限制在256字节内-->
<lastmod>2014-05-01</lastmod>
<!--更新时间标签,非必填,用来表示最后更新时间-->
<changefreq>daily</changefreq>
<!--更新频率标签,非必填,用来告知引擎页面的更新频率 -->
<priority>0.5</priority>
<!--优先级标签,优先级值0.0-1.0,用来告知引擎该条url的优先级-->
</url>
<url>
<loc>http://m.domain.com/123.xhtml</loc>
<lastmod>2014-05-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
索引xml文件格式示例:
1.顶层Sitemap格式
<sitemapindex>
<sitemap>
<loc>
http://www.abc.com/sitemap_v2/detail_new/index/index_1.xml
</loc>
<lastmod>2013-12-18 12:59:12</lastmod>
<!--更新时间标签,必填,用来表示xml文件最后更新时间-->
</sitemap>
</sitemapindex>
2.中间层Sitemap格式(非必要,视url数量而定)
<sitemapindex>
<sitemap>
<loc>
http://www.abc.com/sitemap_v2/detail_new/1/1.xml
</loc>
<lastmod>2013-12-18 12:59:12</lastmod>
</sitemap>
</sitemapindex>
Sitemap的介绍以及如何使用相关推荐
- html站点地图是什么,网站地图(sitemap)是什么意思?网站地图标签介绍
一个城市要有地图,人们才会知道现在在哪里,还有哪边可以去.同样道理,一个网站也要有地图,搜索引擎蜘蛛才会知道有哪些网页可以去.而这个地图就叫做「网站地图」(sitemap). 网站地图是什么意思? 没 ...
- [SEO]让你的Asp.Net网站自动生成Sitemap——XmlSitemap
首先我要说明:Asp.Net内置的Sitemap与这里讲的Sitemap是完全不同的,Asp.Net中的Sitemap主要用于给用户导航,而这里说的Sitemap是用来给搜索引擎爬虫指路. 还是直接来 ...
- 【愚公系列】2022年02月 微信小程序-sitemap站内搜索
文章目录 前言 1.sitemap.json介绍 2.小程序爬虫特征 一.sitemap 配置 1.rules配置项 1.1 rules 1.1.1 matching 二.配置示例 前言 1.site ...
- 使用Hexo在Github搭建静态博客
为什么80%的码农都做不了架构师?>>> 1. 环境环境 1.1 安装Git 请参考[1] 1.2 安装node.js 下载:http://nodejs.org/downloa ...
- 【零基础】学会微信小程序开发-上手微信开发者工具
本篇文章,你将学会如何使用微信开发者工具开发微信小程序 1)首先,我们访问微信开发者工具下载地址,如下图所示,我们下载稳定版本,按你系统去选择Windows 或者macOS,我这里因为是Windows ...
- 网络推广策略带你了解网站地图Sitemap的作用是什么?
在网站优化中,网络推广策略中的网站地图Sitemap的初心是为了方便用户浏览而建立的.最后不仅达到了提升用户体验的目的,还能逐渐吸引搜索引擎的注意,从此提升网站的收录率,实现一举两得的效果.那么网站地 ...
- 动态构建siteMap(导航,asp.net)
这里介绍两种主要的方法, 先进行情景假定: 假定进入一个主页, 此主页包含两大模块, 一个叫做mod1, 一个叫做mod2, 点击第一个模块进行mod1 的主页, 左侧有树形列表显示mod1 的内容, ...
- 百度爬虫爬到虚拟链接 网站被黑_网站地图sitemap对SEO优化有什么作用?
网站地图:是指明网站基本信息的页面,如网站结构.栏目.内容描述等,用户可以借助网站地图快速了解网站信息,反过来说,一个设计良好的网站地图应该起到让用户快速了解网站结构和内容的作用. 网站地图实际上并非 ...
- Hsiaoyang: Google与站点地图Sitemap
Hsiaoyang: Google与站点地图Sitemap 无论网站大小,网站地图是一个网站必备的组件.它不见可以使用户对网站的内容一目了然,而且方便搜索引擎对网站内容快速.全面的抓取. 网站地图可以 ...
最新文章
- POJ1904 强联通(最大匹配可能性)
- wps中的相交_【研途技能贴】| WPS里的布尔运算
- java正则 环视_正则表达式之环视(java)
- 团队作业9——第二次项目冲刺2(Beta阶段)
- python shutil模块用法实例分析_Python shutil模块用法实例分析
- python中的tkinter_基于python中tkinter的计算机实现
- 火狐浏览器如何设置启动页面
- js array 删除指定元素_Array 原型方法源码实现解密
- Python:assert基本用法
- python deap_遗传算法库DEAP的示例代码的学习和分析
- 小米9开发版刷稳定版心得体验
- pandas 二维表与一维记录的转换
- 问题:During startup program exited with code 0xc0000135
- Android 显示软键盘输入法和强制隐藏软键盘输入法
- Cisco NAT --- ip nat enable NVI方式
- 每日一题:1894.找到需要补充粉笔的学生编号 简单的模拟题目,注意求余的技巧!...
- 基于requests-html的python爬虫
- 中国石油大学-《大学英语二》第二阶段在线作业
- 亚信安全:坚持自主可控 做中国本土化专业化的安全公司
- Kali Linux 折腾笔记