http://teachmyself.blog.163.com/blog/static/18881422920119895248288/

Sitemap.xml是 google搞出来的,也就是网站地图,不过这个网站地图是用xml写的,而且要按google的标准来写,并且要将写出来的这个文件 sitemap.xml上传到自己的服务器空间中去。目前,Google, Yahoo, MSN都已经声明支持这种格式,Baidu还没有声明支持,但估计走这一步也是大势所趋。这将是向众多搜索引擎提供你网站信息的一种很好的方法。

   提交sitemap一是有利于搜索抓取一些正常抓取过程中无法抓取的网址,比如动态网页,包含大量AJAX的网页或者flash的页面。二是为搜索蜘蛛 指明“工作方向”。Sitemap就是你网站上页面的列表,googlebot就按照这个去一个个的抓取收录页面,显然比它自己去找会效率高,而且要全。 Google网站上有完整的关于sitemap.xml的详细说明:

  http://www.google.com/support/webmasters/bin/answer.py?answer=40318&hl=zh_CN

  但很多站长看后仍然不会操作,下面这个教程就是手把手教会你创建Sitemap.xml。

1.         Sitemap.XML 的格式

完整格式如下:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" ><url><loc>http://www.yrtrip.com/default.asp</loc><lastmod>2008-07-17</lastmod><changefreq>daily</changefreq><priority>1.0</priority></url><url><loc> http://www.yrtrip.com/search2.asp?id=32003044&amp;sq=1</loc><lastmod>2008-07-17</lastmod><changefreq>weekly</changefreq><priority>0.9</priority></url>……
</urlset>

下面,对以上标签分别加以解释

a)       <?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

这两行就相当于网页文件中的<html>标签一样的作用。不必管这两行什么意思,照抄即可。

切记:一个字符也不能错,即使多一个空格,google网站采集时也会报错。另外,千万别忘了在文件的末尾加上</urlset>标签。

  b) url:每个标签包含一个网页地址,是以下标签的父标签。

  c) http://www.yrtrip.com/default.asp

  这里是页面链接地址,也就是你希望蜘蛛访问的地址。

   切记:在地址中出现的某些特殊字符需要使用转义字符,否则,google也会报错。最典型的就是 & 号,经常在动态网址中出现,在提交地址中必须写成 & 如:提交http://www.yrtrip.com/search2.asp?id=32003044&sq=1,google管理员工具就会 报错,而改为 http://www.yrtrip.com/search2.asp?id=32003044&sq=1提交后就没有问题了。我看到网上有人说 sitemap.xml只能提交一个参数的网页的说法,其实多半是因为没有使用转义字符而导致出错的。其他的转义字符就不一一列出了,大家可以在网上查。

  d) lastmod:页面最后修改时间

   这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行 比较,如果时间一样就会跳过不再索引。所以如果你的链接内容基于上次Google索引时的内容有所改变,应该更新该时间,让Google下次索引时会重新 对该链接内容进行分析和提取关键字。这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:

  •   年:YYYY(2008)
  •   年和月:YYYY-MM(2008-06)
  •   年月日:YYYY-MM-DD(2008-06-04)
  •   年月日小时分钟:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37+08:00)
  •   年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37:30+08:00)

  这里需注意的是TZD,TZD指定就是本地时间区域标记,像中国就是+08:00了

  切记:其他格式可能引起出错,比如将2008-08-08 写成2008-8-8就会出问题。

  e) changefreq:页面内容更新频率。

  这里可以用来描述的单词共这几个:"always", "hourly", "daily", "weekly", "monthly", "yearly",具体含义我就不用解释了吧,光看单词的意思就明白了。

  f) priority:相对于其他页面的优先权

  定于0.0 - 1.0之间 。

  切记:建议将各类网页根据重要性给出不同的数值,以方便蜘蛛的采集,不要耍小聪明全部写1.0,google管理工具会报错的。

  2. Sitemap.xml制作方式

  制作方式无非两种,自动方式和手动方式。

  自动方式一般使用生成工具自动生成,只需输入自己的网址,就可以得到完整的xml文件。这种方式一般适用于静态网站,在此不再赘述。但需要提醒的是,网上的工具良莠不齐,生成的文件经常有错误,不一定能通过google的校验,使用者需认真辨别。

  手工方式则是由站长手工填写或写程序完成均可,代码很简单,大家可以到网上查找。

  3. 提交

  Sitemap.xml制作完成后,就需要将xml文件提交到相关搜索引擎。

  Google提交网址:http://www.google.com/webmasters/sitemaps/?hl=zh-CN

  Yahoo提交网址:http://sitemap.cn.yahoo.com/

  提交后,一般在几个小时之内,系统就开始下载处理了。

  4. Sitemap.xml的校验

  至于你的网站地图是否符合标准,最方便的手段就是使用google的管理员工具了。

   在他下载你的sitemap.xml后几天内,这个工具就会将详细的分析结果反馈回来,包括:sitemap.xml中包含了多少地址,google已 将多少地址加入索引,sitemap.xml中出现了哪些错误,甚至蜘蛛采集过程中遇到的各种问题,比如哪些网页有404,500错误都会详细的罗列出 来,非常方便。

  如果你提交的xml文件一切无误,那么接下来,你就是等着让它的搜索蜘蛛来爬了,sitemap的文件告知了文件更新的频率,这样搜索蜘蛛来得更勤快,页面被收录当然也就更快。

  5分半钟:Google网站地图 Sitemap.xml

教你创建Google网站地图Sitemap.xml(转)相关推荐

  1. 动态生成网站地图sitemap.xml

    在做网站地图时更新成了一个麻烦,于是想到返回一个虚拟xml,动态生成网站地图. 例如sitemap.xml ,如果每次增加新网页都要在静态文件中添加url工程量将非常大,所有想到每次请求都查询新的网站 ...

  2. 网站地图sitemap.xml的格式

    URL列表-XML格式及规范说明: 标签名称  属性  标签说明  标签类型  标签限制  可选/必选  urlset  / urlset用来标记整个文档的开头  /  /  必选  url  / u ...

  3. WordPress代码实现网站地图sitemap的html和xml的方法

    今天介绍的就是不使用插件完成WordPress代码实现网站地图sitemap的html和xml的方法,本站以前一直用着柳城的百度地图插件,今天心血来潮,想着还是直接代码吧,少用插件的好! 下面我就直接 ...

  4. 帝国cms建立自定义页面来创建网站地图sitemap.html

    帝国cms用自定义页面来创建网站地图sitemap.html的方法.具体步骤有三步,1.创建自定义模板(网站地图模板):2.创建自定义页面(调用网站地图模板):3.刷新自定义页面(生成sitemap. ...

  5. 向百度提交网站地图Sitemap

    我知道可以通过Google 网站管理员工具向 Google 提交网站地图 Sitemap,那么我如何向百度.雅虎等其他搜索引擎提交呢?我是否需要制作一个类似 Google Sitemap 一样的 ba ...

  6. php生成站点地图,php生成百度站点地图sitemap.xml

    header("Content-type:text/html;charset=utf-8"); //php生成百度站点地图sitemap.xml //http://www.baid ...

  7. nuxt.js做站点地图(sitemap.xml)详解

    前言 在做跨境电商项目中seo是必须要做的,seo中站点地图(sitemap.xml,robots.txt)又是必不可少的,这里就记录一下nuxt中站点地图是如何做的. 第一步:安装@/nuxt/si ...

  8. 帝国cmssitemap.php,帝国CMS网站地图sitemap的制作

    帝国CMS网站地图sitemap的制作 (2012-02-04 20:50:32) 标签: 杂谈 以前网站一直用的是在线生成工具来生成网站地图,比较方便,但是发现在线生成的无法显示出网站结构和全部的内 ...

  9. html站点地图是什么,网站地图(sitemap)是什么意思?网站地图标签介绍

    一个城市要有地图,人们才会知道现在在哪里,还有哪边可以去.同样道理,一个网站也要有地图,搜索引擎蜘蛛才会知道有哪些网页可以去.而这个地图就叫做「网站地图」(sitemap). 网站地图是什么意思? 没 ...

最新文章

  1. ISO9000机房管理办法
  2. Python的零基础超详细讲解(第二天)-Python的基础语法1
  3. Python3 websocket server与client
  4. 18.图像用户界面入门:EasyGui
  5. java怎么将加载图片消除_Java中加载图片的方法
  6. python3精要(6)-string类的format()方法
  7. 高中计算机网络安全教案,浙教版高中信息技术教案信息安全
  8. 硬链接与软链接的区别
  9. pythonchallenge_level2
  10. 【图形学手记】蒙特卡洛积分
  11. idea的debug基本用法快捷键
  12. Error information: “Error: SignerSign() failed.“ (-2147012889/0x80072ee7)
  13. 读书笔记-穿越计算机的迷雾
  14. 揭秘封包辅助外G:封包外G初体验(四)
  15. 棋牌类游戏的开发心得
  16. PHP网站从服务器下载文件到本地
  17. 力扣(700.701)补9.9
  18. 一个简单的B站视频抽奖小程序
  19. 【人工智能】人工智能学习常用社区
  20. 【Android】Android Studio左侧的目录工具栏

热门文章

  1. python爬虫面试遇到的问题
  2. 如何设置ad18捕捉图标_图标设计中的像素捕捉
  3. 成为自信的node.js开发者(一)
  4. vue-cli新建的项目webpack设置涉及的大部分插件整理
  5. SQL Server编程(06)触发器
  6. Android Ap 开发 设计模式第六篇:原型模式
  7. 走向无后端的系统开发实践:CRUD自动化与强约定的REST接口
  8. ubuntu安装时发现GPT分区表,无法安装问题
  9. [转]android 获取手机GSM/CDMA信号信息
  10. (转)Android基础类之BaseAdapter