自我学习,仅供参考:

数据库总是会遇到各种失败的场景,如网络连接断开、断电等,尽管journaling日志功能也提供了数据恢复的功能,但journaling通常是针对单个节点来说的,只能保证单节点数据的一致性,而复制集通常是由多个节点组成,每个节点除了journaling日志恢复功能外,整个复制集还具有故障自动转移的功能,这样能保证数据库的高可用性。在生产环境中一个复制集最少应该包含三个节点,其中有一个必须是主节点,典型的部署结构如下图:

其中每个节点都是一个mongod进程对应的实例,节点之间互相周期性的通过心跳检查对方的状态,默认情况下primary节点负责数据的读、写,second节点备份primary节点上的数据(如何备份?下面会分析),但是arbiter节点不会从primary节点同步数据,从它的名字arbiter可以看出,它起到的作用只是当primary节点故障时,能够参与到复制集剩下的节点中,选择出一个新的primary节点,它自己永远不会变为primary节点,也不会参与数据的读写。也就是说,数据库的数据会存在primary和second节点中,second节点相当于一个备份,当然second节点可以有多个,当primary节点故障时,second节点有可能变为primary节点。上图是一个生产环境所需的最少节点数,下面就配置一个这样的复制集。

(1)创建复制集中每个节点存放数据的目录

E:\mongodb-win32-i386-2.4.3\db_rs0\data\rs0_0

E:\mongodb-win32-i386-2.4.3\db_rs0\data\rs0_1

E:\mongodb-win32-i386-2.4.3\db_rs0\data\rs0_2

(2)创建复制集中每个节点的日志文件

E:\mongodb-win32-i386-2.4.3\db_rs0\logs\rs0_0.log

E:\mongodb-win32-i386-2.4.3\db_rs0\logs\rs0_1.log

E:\mongodb-win32-i386-2.4.3\db_rs0\logs\rs0_2.log

(3)为复制集中的每个节点创建启动时所需的配置文件

第一个节点配置文件为:E:\mongodb-win32-i386-2.4.3\configs_rs0\rs0_0.conf 内容如下:

dbpath = E:\mongodb-win32-i386-2.4.3\db_rs0\data\rs0_0

logpath = E:\mongodb-win32-i386-2.4.3\db_rs0\logs\rs0_0.log

journal = true

port = 40000

replSet = rs0

其中dbpath指向数据库数据文件存放的路径(在第一步中已创建好),logpath指向数据库的日志文件路径(第二步中已创建好),journal表示对于此mongod实例是否启动日志功能,port为实例监听的端口号,rs0为实例所在的复制集名称,更多参数的意思可以参考mongoDB手册。

第二个节点配置文件为:E:\mongodb-win32-i386-2.4.3\configs_rs0\rs0_1.conf 内容如下:

dbpath = E:\mongodb-win32-i386-2.4.3\db_rs0\data\rs0_1

logpath = E:\mongodb-win32-i386-2.4.3\db_rs0\logs\rs0_1.log

journal = true

port = 40001

replSet = rs0

第三个节点配置文件为:E:\mongodb-win32-i386-2.4.3\configs_rs0\rs0_2.conf 内容如下:

dbpath = E:\mongodb-win32-i386-2.4.3\db_rs0\data\rs0_2

logpath = E:\mongodb-win32-i386-2.4.3\db_rs0\logs\rs0_2.log

journal = true

port = 40002

replSet = rs0

(4)启动上面三个节点对应的mongoDB实例

mongod –config  E:\mongodb-win32-i386-2.4.3\configs_rs0\rs0_0.conf

mongod –config  E:\mongodb-win32-i386-2.4.3\configs_rs0\rs0_1.conf

mongod –config  E:\mongodb-win32-i386-2.4.3\configs_rs0\rs0_2.conf

观察一下每个实例的启动日志,日志中都有如下内容:

[rsStart] replSet can't get local.system.replset config from self or any seed (EMPTYCONFIG)

[rsStart] replSet info you may need to run replSetInitiate -- rs.initiate() in the shell -- if that is not already done

上面日志说明虽然已经成功启动了三个实例,但是复制集还没配置好,复制集的信息会保存在每个mongod实例上的local数据库中即local.system.replset上。按照上图所描述那样,你应该通过配置确定哪个节点为primary、哪个为second、哪个为arbiter。下面开始配置复制集。

(5)启动一个mongo客户端,连接到上面的一个mongod实例

>mongo --port 40000

运行以下命令初始化复制集

> rs.initiate()

{

"info2" : "no configuration explicitly specified -- making one",

"me" : "Guo:40000",

"info" : "Config now saved locally.  Should come online in about a min e.",

"ok" : 1

}

这个时候的复制集还只有刚才这个初始化的成员,通过如下命令查看到。

> rs.conf()

{

"_id" : "rs0",

"version" : 1,

"members" : [

{

"_id" : 0,

"host" : "Guo:40000"

}

]

}

按照mongoDB的默认设置,刚才执行初始化命令的这个mongod实例将成为复制集中的primary节点。

(6)接下来在复制集中添加上图中的second节点和arbiter节点,继续在上面那个mongod实例上执行如下命令:

rs0:PRIMARY> rs.add("Guo:40001")

{ "ok" : 1 }

rs0:PRIMARY> rs.addArb("Guo:40002")

{ "ok" : 1 }

注意此时命令的前缀变为了:rs0:PRIMARY,说明当前执行命令的机器是复制集中primary机器,上面的命令通过rs.add()添加一个默认的second节点,rs.addArb()添加一个默认的arbiter节点。命令成功执行后,就会生成上图所示那样的一个复制集。

(7)观察整个复制集的状态信息,几个重要参数会在后面说明。

rs0:PRIMARY> rs.status()

{

"set" : "rs0",//复制集的名称

"date" : ISODate("2013-08-18T09:03:49Z"),

"myState" : 1, //当前节点成员在复制集中的位置,如1表示primary,2表示secondry

"members" : [//复制集的所有成员信息

{

"_id" : 0, //成员编号

"name" : "Guo:40000",//成员所在的服务器名称

"health" : 1,//成员在复制集中是否运行,1表示运行,0失败

"state" : 1,//成员在复制集中的状态,1是primary

"stateStr" : "PRIMARY",//成员在复制集中的状态名称

"uptime" : 2186,//成员的在线时间,单位是秒

"optime" : {//这个是用来进行同步用的,后面重点分析

"t" : 1376816431,

"i" : 1

},

"optimeDate" : ISODate("2013-08-18T09:00:31Z"),

"self" : true //成员为当前命令所在的服务器

},

{

"_id" : 1,

"name" : "Guo:40001",

"health" : 1, ,//成员在复制集中是否运行,1表示运行

"state" : 2 ,//成员在复制集中的状态,2是secondary

"stateStr" : "SECONDARY",

"uptime" : 306,

"optime" : {

"t" : 1376816431,

"i" : 1

},

"optimeDate" : ISODate("2013-08-18T09:00:31Z"),

"lastHeartbeat" : ISODate("2013-08-18T09:03:47Z"),

"lastHeartbeatRecv" : ISODate("2013-08-18T09:03:47Z"),

"pingMs" : 0,//此远端成员到本实例间一个路由包的来回时间

"syncingTo" : "Guo:40000"//此成员需要从哪个实例同步数据

},

{

"_id" : 2,

"name" : "Guo:40002",

"health" : 1,

"state" : 7, //成员在复制集中的状态位置,7是arbiter

"stateStr" : "ARBITER",

"uptime" : 198,

"lastHeartbeat" : ISODate("2013-08-18T09:03:49Z"),

"lastHeartbeatRecv" : ISODate("1970-01-01T00:00:00Z"),

"pingMs" : 0,//此远端成员到本实例间一个路由包的来回时间

}

],

"ok" : 1

}

上面复制集状态信息的输出是基于primary实例的,也可以再secondary实例上输出复制集的状态信息,包含的字段与上面大致相同。上面的输出有些地方还需进一步解释,如在arbiter成员节点上,没有字段syncingTo,说明他不需要从primary节点上同步数据,因为它只是一个当主节点发生故障时,在复制集中剩下的secondary节点中选择一个新的priamry节点的仲裁者,因此运行此实例的机器不需要太多的存储空间。

上面输出的字段中还有几个时间相关的字段如:"date"表示当前实例所在服务器的时间,"lastHeartbeat"表示当前实例到此远端成员最近一次成功发送与接收心跳包的时间,通过比较这个两个时间可以判断当前实例与此成员相差的时间间隔,比如某个成员宕机了,本实例发像此宕机成员的心跳包就不会被成功接收,随着时间推移,本实例的data字段值与此成员上的lastHeartbeat差值就会逐渐增加。

上面还有一个optime字段,这个字段的值说明了本实例最近一次更改数据库的时间"t" : 1376816431以及每秒执行的操作数据库的次数"i" : 1,此字段的值实际上是从本实例上的local数据库中的oplog.rs集合上读取的,这个集合还详细记录了具体是什么操作,如插入语句、修改语句等。复制集中的每一个实例都会有一个这样的数据库和集合,如果复制集运行正常,理论上来说,每一个mongod实例上此集合中的记录应该相同。实际上mongoDB也是根据此集合来实现复制集中primary节点与secondary节点间的数据同步。

转载于:https://www.cnblogs.com/guoyuanwei/p/3279572.html

mongoDB研究笔记:复制集概述相关推荐

  1. 复制集配置文件linux,mongodb的复制集实现

    简介: mongodb有两种类型的复制,第一种是同于MySQL的主从复制模式,第二种是复制集,提供了自动故障转移的主从复制集群.其中复制集没有固定的主节点,当一个主机的故障后从节点会重新"选 ...

  2. mongodb之 复制集维护小结

    原文地址:https://www.cnblogs.com/zhaowenzhong/p/5667312.html 一.新增副本集成员 1.登录primary 2.use admin >rs.ad ...

  3. MongoDB 3.4 复制集全量同步改进

    3.2版本复制集同步的过程参考MongoDB 复制集同步原理解析 在 3.4 版本里 MongoDB 对复制集同步的全量同步阶段做了2个改进 在拷贝数据的时候同时建立所有的索引,在之前的版本里,拷贝数 ...

  4. MongoDB复制集(Replication Sets)介绍

    近年来,随着大数据越来越火,非关系型数据库的重要性被越来越多的人所认知,越来越多的开发者逐渐加入到NoSQL的阵营中.我们知道NoSQL是Not Only SQL的意思,既然如此,很多关系型数据库所支 ...

  5. Centos下安装MongoDB复制集

    2019独角兽企业重金招聘Python工程师标准>>> 在一台Centos下模拟安装MongoDB的复制集 准备三份配置文件: mongod.conf bind_ip=0.0.0.0 ...

  6. 配置MongoDB复制集

    什么是复制集? 复制集是额外的数据副本,是跨多个服务器同步数据的过程,复制集提供了冗余并增加了数据可用性,通过复制集可以对硬件故障和中断的服务进行恢复. 复制集的优势如下: 让数据更安全 高数据可用性 ...

  7. MongoDB复制集技术

    为什么使用MongogDB复制集技术? mysql中:一主一从,一主多从结构存在的问题 1. fileover(故障转移)a) 选主投票b) 切换 2. 是否对就用透明化 3. 数据补偿的问题a) 两 ...

  8. mongodb索引生成HTML页面,mongodb高阶:索引创建、聚合查询、复制集、分片、创建备份和部署...

    先前我们讨论了mongodb的进阶查询:投影查询.分页查询以及对查询结果进行排序,从本节起我们开始学习mongodb相关的高级技术,首先我们会讨论mongodb如何创建索引,索引是数据库中最重要的东西 ...

  9. mongodb 复制集 维护小结

    副本集成员最多12个成员,其中只有7个成员拥有投票权.这是为了减少 心跳请求的网络流量和选举话费的时间.心跳每2秒发送一次. 一.新增副本集成员 1.登录primary 2.use admin > ...

最新文章

  1. matlab中的数值计算,MATLAB数值计算(中译本,最新修订)
  2. html与css项目,项目六HTML与CSS基础.doc
  3. 数据结构实验之二叉树七:叶子问题
  4. qtchart实时动态曲线_极致新体验,实时、无损、长时程细胞分析检测平台
  5. 如何更改指定用户在windows系统目录的权限
  6. SharePoint关于publish page, WiKi page, Web part page区别
  7. mysql二进制安装方法
  8. 运算符的优先级及有哪些运算符
  9. 圣斗士星矢服务器维护时间,《圣斗士星矢》6月27日服务器数据互通公告
  10. google控制台使用
  11. CODEVS 3027 线段覆盖2
  12. 信用评分卡模型python_信用评分卡模型在Python中实践(下)
  13. 九度oj 题目1029:魔咒词典
  14. 【软考软件评测师】2016年下案例分析历年真题
  15. RTB广告展示分步说明
  16. Centos7.5安装Chrome浏览器
  17. python实现qq登录界面_Python实现QQ界面
  18. java打印2到10000的所有素数(质数),每行显示8个素数
  19. Win11系统白名单列表如何添加软件
  20. Google打印没有彩色,浏览器打印预览没有背景颜色和没有颜色

热门文章

  1. [转] linux IO
  2. Python面向对象(继承)
  3. SpringCloud与Docker微服务架构实战pdf
  4. 深入浅出话命令(Command)-笔记(-)
  5. 解决bootstrap-table多次请求只触发一次的问题
  6. UIImageView图片视图的基本概念和使用方法
  7. ENVI5.1安装破解教程
  8. frame,iframe,frameset用法和区别
  9. 清空SQL Server数据库日志的SQL语句
  10. 关于Java里面File类创建txt文件重复???