MongoDB 复制

复制功能、故障发现、优先选举、投票成员、副本集搭建

一、副本集

1.1 复制功能

为保证数据安全,实现高可用,MongoDB 提供了复制功能,可以将主节点上的数据复制到多个从节点上,这样即便主节点出现异常,由于数据是以多副本的方式进行存储,仍然可以保证数据安全。一个标准的三节点副本集架构如下:

复制过程如下:

1. 初始同步

在副本集初始化时,主节点的 mongod 进程会扫描当前节点上每个数据库中的每个集合,然后将这些数据发送给从节点,进行初始化的全量复制。

2. 同步复制

从节点在初始化完成后,不断同步地复制主节点的 oplog 数据。oplog (操作日志) 是一个特殊的集合,它存储了数据库中所有数据的操作记录。oplog 中的每个操作都具有幂等性,即每个操作对目标数据集无论是应用一次还是多次,都会产生相同的结果。

3. 异步执行

MongoDB 按 namespace 或 document id 对每批操作进行分组,并使用不同的线程应用每组操作,同时 MongoDB 会严格按照原始写入顺序将写入操作应用于从节点上的文档。

1.2 仲裁者

除了可以将正常的 mongod 实例添加到副本集外, 还可以将额外的 mongod 实例添加到副本集作为仲裁者。仲裁者不承担数据的读写操作,它只用于响应选举请求并参与仲裁。因为它不存储数据,所以可以占用更少的服务器资源,如果你的副本集具有偶数个成员,可以通过添加仲裁者来保证有效选举。

虽然仲裁者可以占用更少的服务器资源,但是由于其并不存储数据,所以对数据的安全性并不能起到帮助作用。因此应该尽量避免使用仲裁者,同时尽量保证最多只使用一个仲裁者,即如果节点数量恰好是偶数,则添加一个仲裁者,如果节点数量是奇数,那就不需要仲裁者。

二、故障发现与恢复

2.1 故障发现

副本集的每个节点之间会维持着两秒一次的心跳检测,当从节点与主节点的通信时间超过配置的 electionTimeoutMillis 时间 (默认为10秒) 时,则认为该主节点出现故障,此时副本集会进行新的主节点选举。

2.2 优先选举

MongoDB 的选举算法会尝试让高优先级的节点优先发起选举,从而更容易在选举中胜出。如果某一个优先级较低的节点在短时间内被选举为新的主节点,这时副本集仍然会继续发起选举,直至可用的最高优先级的节点成为新的主节点。需要特别注意的是在这个过程当中,优先级为 0 的成员不能寻求选举,也不能成为主节点。

2.3 投票成员

节点发起选举后,需要具有投票权的节点进行投票,当获得半数以上选票时,该备用节点可以成为新的主节点。对于一个复制集,只有处于以下状态的节点拥有投票权,这些节点统称为投票成员:

  • PRIMARY :副本集的主节点。
  • SECONDARY :处于复制状态的从节点。
  • STARTUP2 :mongod 完成配置加载后,副本集的每个成员都进入 STARTUP2 状态,此时它成为副本集的活动成员并且有资格投票。然后该成员决定是否进行初始同步。如果成员开始初始同步,则成员将保留在 STARTUP2 状态,直到所有数据复制完成并构建好索引。之后成员过渡到 RECOVERING。
  • RECOVERING :当副本集的成员尚未准备好接受读取操作时,它将进入 RECOVERING 状态。处于恢复状态的成员有资格在选举中投票,但没有资格成为主节点。
  • ARBITER :ARBITER 状态的成员不复制数据或接受写入操作,仲裁者通常处于这一状态。
  • ROLLBACK :如果成员正在进行数据回滚,它就处于 ROLLBACK 状态。

除了投票成员外,那些持有副本集数据的副本,并且可以接受来自客户端应用程序的读取操作,但没有投票权的成员统称为非投票成员。出于网络通讯成本的考虑,MongoDB 的副本集最多有 50 个节点(成员),默认情况下最多可包含 7 个投票成员。投票成员和非投票成员的要求如下:

  • 非投票成员的优先级 members[n].priority 必须为 0,优先级为 0 的成员不能寻求选举,也不能成为主节点。
  • 优先级大于 0 的节点持有的票数 members[n].votes 不能为 0,该参数默认值为 1,可选值为 1 或 0。

如下示例是一个 9 个成员的副本集,包含 7 个投票成员和 2 个无投票成员:

三、搭建副本集

这里以搭建一个三节点的副本集为例,使用三台服务器,主机名分别为 hadoop001,hadoop002,hadoop003。

3.1 下载并解压

选择所需版本的 MongoDB 进行下载,下载地址为: https://www.mongodb.com/download-center/community

这里我下载的版本为 4.0.10 , 安装环境为 RHEL 7.0,下载后进行解压:

 tar -zxvf mongodb-linux-x86_64-rhel70-4.0.10.tgz -C /usr/app

3.2 配置环境变量

配置环境变量:

vi /etc/profile
export MONGODB_HOME=/usr/app/mongodb-linux-x86_64-rhel70-4.0.10/
export  PATH=${MONGODB_HOME}/bin:$PATH

使得配置的环境变量立即生效:

source /etc/profile

3.3 修改配置

MongoDB 默认存放数据的目录为 /var/lib/mongo ,默认存放日志的目录为 /var/log/mongodb,采用 TGZ 安装包进行安装时,程序不会自动创建这两个目录,需要预先手动创建。同时由于 /var/ 下只能存放临时文件,所以这里我们使用其他目录进行存储,命令如下:

mkdir -p /home/mongodb/data
mkdir -p /home/mongodb/log

修改配置,采用 TGZ 安装包进行安装时,程序不会自动创建配置文件,需要手动创建:

vim /etc/mongod.conf

在配置文件中增加如下配置,这里的配置采用的是 YAML 的格式:

processManagement:
    # 以后台进程的方式启动 
    fork: true
systemLog:
    destination: file
    path: "/home/mongodb/log/mongod.log"
    logAppend: true
storage:
    dbPath: "/home/mongodb/data"
net:
    port: 27017
    # 如果不修改绑定IP,默认只能在本机访问数据库服务
    bindIp: 0.0.0.0
replication:
    # 处于同一副本集的所有节点需要保证副本集名称一致
    replSetName: rs0  

MongoDB 的所有配置项可以参考其官方文档:Configuration File Options

3.4 启动服务

以上配置步骤在三台主机上均相同。之后启动三台主机上的 mongod 服务,命令如下:

mongod -f /etc/mongod.conf

3.5 配置副本集

在任意一台主机上使用 mongo shell 连接到本地服务,之后直接使用以下命令配置副本集:

rs.initiate( {
   _id : "rs0",
   members: [
      { _id: 0, host: "hadoop001:27017" },
      { _id: 1, host: "hadoop002:27017" },
      { _id: 2, host: "hadoop003:27017" }
   ]
})

3.6 查看副本集情况

使用 rs.status() 命令查看副本集状态,部分输出如下。从输出中可以看到 hadoop001 为 PRIMARY 节点,而 hadoop002 和 hadoop003 均为 SECONDARY 节点,此时代表副本集已经搭建成功。

参考资料

下一节:分片副本集配置、配置副本集配置、路由服务配置