当你用Jekyll辛辛苦苦搭建好了个人博客网站,兴奋的想要在谷歌上搜索自己的博客信息时,却突然发现完全没有任何记录?不止谷歌,其它搜索引擎,例如百度、雅虎等等也是一片空白,此时你是否会心生疑虑,为什么我的网站在搜索引擎中搜不到呢?

想要理解原因,我们首先得明白,为什么其它的网站能被搜索引擎收录?原因是搜索引擎的爬虫程序提前抓取了这些网站的相关信息,然后收录下来供搜索使用。

想让自己的网站被收录,一个办法是被动等待爬虫访问你的网站,但是在internet浩瀚的海洋中,这犹如大海捞针,非常困难。另一个办法就是主动通知爬虫,告诉他们这里有信息希望被收录。

所以对于自建博客的我们来说,把文章发到博客上还不能算结束,我们得想办法主动提高博客被收录的几率,下面让我来介绍几个相关的小技巧。

技巧1:提交sitemap文件

sitemap又称站点地图,顾名思义它就像一张地图一样,记录了网站所有网页的路径信息,例如下面的例子:

<?xml version="1.0" encoding="UTF-8"?>
<urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url><loc>https://www.taowong.com/blog/2018/06/22/eos-develop-1.html</loc><lastmod>2018-06-25T15:07:14+00:00</lastmod><priority>0.80</priority>
</url>
<url><loc>https://www.taowong.com/archive.html?tag=%E5%8C%BA%E5%9D%97%E9%93%BE</loc><lastmod>2018-06-25T15:07:14+00:00</lastmod><priority>0.80</priority>
</url>

通过这张地图,爬虫程序可以很方便的将网站上所有的网页信息都抓取下去。

Jekyll提供的sitemap插件 Jekyll Sitemap Generator Plugin 让我们可以很方便的生成sitemap信息。除此之外,网上也有很多在线生成sitemap文件的网站,例如 xml-sitemap.com。

生成好文件之后,我们可以通过 Google Search Console 以及 百度搜索资源平台 分别提交给谷歌和百度。

这里需要特别说明的是,对于将代码托管在Github的同学,百度爬虫是无法抓取信息的,因为Github认为百度爬虫抓取过于频繁,将它禁掉了,短期内解禁的可能性也不大。

对于这种情况,我们有三种解决方案:

  1. 无所谓,我有谷歌就够了。
  2. 将代码托管在 Coding 平台。
  3. 使用代理工具。

详细的内容就不展开说了,有兴趣的同学可以自行去研究。

技巧2:在页面头信息中增加keywords和description

找到页面头文件(以我自己为例,是_includes/head.html文件),在其中添加代码。

<meta name="description" content="{{ page.summary | escape }}">
<meta name="keywords" content="{{ page.tags | join: ', ' | escape }}"/>

其中page.summary和page.tags是遵循YAML语法定义的字段,例如下面的示例:

summary: How to add metadata to the Jekyll-based site: google sitemap xml, Open Graph and plain old "meta"-tags.
tags: [jekyll,blogging,facebook,metadata]

这种方式的原理,是通过metadata中的keywords和description关键字,告诉来访的爬虫程序当前页面的关键信息,提高页面在搜索引擎中被匹配的概率。

技巧3:添加Open Graph protocol(开放内容协议)

同样是在页面头文件中添加代码,例如:

<!-- 标题 -->
<meta property="og:title" content="Example title of article">
<!-- 网站名 -->
<meta property="og:site_name" content="example.com website">
<!-- 类型 -->
<meta property="og:type" content="article">
<!-- 页面地址 -->
<meta property="og:url" content="http://example.com/example-title-of-article">
<!-- 略缩图地址 -->
<meta property="og:image" content="http://example.com/article_thumbnail.jpg">
<!-- 页面的简单描述 -->
<meta property="og:description" content="This example article is an example of OpenGraph protocol.">

Open Graph protocol(开放内容协议)是一种新的HTTP头部标记,这种协议可以让网页成为一个“富媒体对象”,通过这个协议,网页内容可以被其他社交网站网站(例如Facebook)引用,从而增加自己网站的传播力度。

小结

前面提供的知识一些简单的小技巧,除了sitemap,还可以通过其它方式通知搜索引擎,例如手动提交链接,或者在用户访问页面时自动发送链接信息等等。

除了自己解决收录问题,还可以找更专业的人来帮你推广,现在有很多专业做SEO(Search Engine Optimization 搜索引擎优化)的公司,只要你出得起money,没有解决不了的推广问题。

不过个人博客不需要弄那么复杂,简单维护一下就好了,自己做网站,开心最重要啦。

参考资料

Open Graph protocol
Jekyll: how to add metadata to your site
Github Pages + Jekyll搭建博客之SEO - Zhenyu’s Blog

Jekyll建站之搜索引擎收录小技巧相关推荐

  1. 搜索引擎的小技巧【可以组合起来使用】:

    ■ 注意细节:冒号是英文的冒号 一.搜索引擎的小技巧 (1)排除干扰项,减掉干扰项的关键词      关键词 -干扰项的关键词 (2) 想在特定的网站进行搜索,通过site:网站       关键词 ...

  2. 闪灵CMS学校建站系统模板 含小程序

    介绍: 闪灵CMS学校建站系统(含小程序) v3.0 build20180905 更新说明 1.修复:修复后台自定义设置在插入带引号的文本自动转码的问题 2.修复:修复了手机模板产品及新闻分页链接只显 ...

  3. 聊聊数据库建表的15个小技巧

    前言 对于后端开发同学来说,访问数据库,是代码中必不可少的一个环节. 系统中收集到用户的核心数据,为了安全性,我们一般会存储到数据库,比如:mysql,oracle等. 后端开发的日常工作,需要不断的 ...

  4. Wordpress建站-wp建站网站优化收录

    Wordpress个人博客网建站之后应该怎么优化?很多博客主在我们网站建立之后因为相关经验的缺乏,虽然内容文章精致,但在网站建成之后由于种种原因,迟迟得不到收录.虽然很多博主只是单纯地出于喜好分享美好 ...

  5. 总结MySQL建表、查询优化实用小技巧

    MySQL建表阶段是非常重要的一个环节,表结构的好坏.优劣直接影响着后续的管理维护,赶在明天上班前分享总结个人MySQL建表.MySQL查询优化积累的一些实用小技巧. 技巧一.数据表冗余记录添加时间与 ...

  6. mysql建表测试_总结MySQL建表、查询优化实用小技巧

    MySQL建表阶段是非常重要的一个环节,表结构的好坏.优劣直接影响着后续的管理维护,赶在明天上班前分享总结个人MySQL建表.MySQL查询优化积累的一些实用小技巧. 技巧一.数据表冗余记录添加时间与 ...

  7. 爱用建站快速注册支付宝小程序流程

    支付宝小程序快捷注册须知 爱用建站-智慧链接为用户提供企业支付宝小程序快捷注册通道. 1.注册条件:用户拥有企业支付宝账号的用户(个人支付宝不支持) 2.费用:免费 3..上限:每个支付宝账号最多注册 ...

  8. 高效搜索引擎使用小技巧

    这里只是一些简单的搜索小技巧,方便平时查找资料. 1. 准确搜索:给关键词加上英文双引号 eg: "大数据算法" 2. 排除关键词:在搜索内容后面加上空格减号需要排除的关键词 eg ...

  9. 12月最新S-CMS学校建站系统(含小程序)

    csdn下载地址: https://download.csdn.net/download/dujiangdu123/13647666 S-CMS学校建站系统是淄博闪灵网络科技有限公司开发的一款专门为企 ...

最新文章

  1. html5手机端设置date,如何在移动端更好地使用HTML5 date input
  2. CMMI for Development读书笔记-目录
  3. Python从数据库读取大量数据批量写入文件的方法
  4. 京东五星电器送扫地机器人_家电也流行“套餐”,京东五星电器吹响国庆家装“集结号”...
  5. pytorch torch.narrow
  6. AtCoder Regular Contest 101 (ARC101) D - Median of Medians 二分答案 树状数组
  7. 《Linux4.0设备驱动开发详解》笔记--第五章:Linux文件系统与设备文件
  8. 从 Ops 到 NoOps,阿里文娱智能运维的关键:自动化应用容量管理
  9. 一波黑科技即将袭来!StarVR带你感受他们的未来
  10. matplotlib plot 分组_Python数据分析模块二:Matplotlib
  11. linux中iptables乱码,xshell连接CentOS6.5 iptables或ls 输出乱码-Go语言中文社区
  12. git 关于Git每次进入都需要输入用户名和密码的问题解决
  13. Python找出数组中重复数字
  14. VUE2.0 脚手架搭建项目,如何配置本地IP地址访问项目,详解
  15. 如何搭建一个完整的视频直播系统?
  16. SELECT TOP 100 PERCENT * 的含义
  17. 星之轨迹 服务器维护,英雄传说星之轨迹结束运营公告是什么_内容介绍_3DM页游...
  18. PUBG国际服怎么下载 苹果安卓官网下载方法教程
  19. php webshell 木马,消灭php webshell与一句话木马
  20. Linux中正则表达式详细命令及代码(附实验笔记)

热门文章

  1. 网站seo怎么优化(如何提高网站seo排名)
  2. 如何把游戏BGM文件夹中的.bank文件转换为.wav或者.mp3
  3. python学习-108-根据经纬度坐标计算距离
  4. Maven 集成 Wagon
  5. ChatGPT 未来五年会对 NLP 从业者带来怎样的冲击?—分享七月在线nlp高级
  6. 四旋翼惯导融合之观测传感器滞后问题汇总与巴特沃斯低通滤波器设计(气压计MS5611、GPS模块M8N、超声波、PX4FLOW等)
  7. Html页面深度是啥,链接深度
  8. 郑清2461 我是签到题
  9. jQuery实现聊天对话框
  10. Skewed Join Optimization