全量同步

背景

1.Pika Replicate

pika支持master/slave的复制方式，通过slave端的slaveof命令激发
salve端处理slaveof命令，将当前状态变为slave，改变连接状态
slave的向master发送MetaSync请求，在同步之前确保自身db的拓扑结构和master一致
slave下的每个partition单独的向master端对应的partition发起trysync请求，建立同步关系

2.Binlog

pika同步依赖binlog
binlog文件会自动或手动删除
当同步点对应的binlog文件不存在时，需要通过全同步进行数据同步

全同步

1. 简介

需要进行全同步时，master会将db文件dump后发送给slave
通过rsync的deamon模式实现db文件的传输
默认使用pika port+1000作为rysnc传输端口

2. 实现逻辑

在pika实例启动的同时会启动Rsync服务
master发现某一个partition需要全同步时，判断是否有备份文件可用，如果没有先dump一份
master通过rsync向slave发送对应partition的dump的文件
slave的对应partition用收到的文件替换自己的db
slave的对应partition用最新的偏移量再次发起trysnc
完成同步

Slave中某一个Partition建立同步:

Master处理同步请求：

3. Slave连接状态

No Connect：不尝试成为任何其他节点的slave
ShouldMetaSync：向master请求db的拓扑信息，确保与自身一致
TryConnect：为每个partition重置状态机，让其处于准备同步的状态
Connecting：在所有partition没有建立同步关系之前一直是处于connecting的状态
EstablishSucces: 所有partition建立同步关系成功
Error：出现了异常

增量同步

背景：

从库Pika得到主库的全部DB结构，接下来以partition维度做Trysync，如果从库确认可以增量同步，从库将以partition为维度进行增量同步。默认使用pika port+2000的端口进行增量同步。

Binlog 结构：

Pika的主从同步是使用Binlog来完成的，一主多从的结构master节点也可以给多个slave复用一个Binlog，只不过不同的slave在binglog中有自己的偏移量而已，master执行完一条写命令就将命令追加到Binlog中，pika的同步模块会读出对应的binlog发送到slave，而slave收到binlog后会执行并追加到自己的Binlog中，由于主从偏移量一样，所以一旦发生网络或节点故障需要重连主从时，slave仅需要将自己当前的Binlog偏移量发送给master，master找到后从该偏移量开始同步后续命令，理论上将命令不做处理一条一条追加到文件中，但是这样的记录格式容错很差，如果读文件中写错一个字节则导致整个文件不可用，所以pika采用了类似leveldb log的格式来进行存储，具体如下：

交互过程：

1，从库发送BinlogSyncRequest 报文，报文中需说明自己已经收到的BinlogOffset。

2，主库收到BinlogSyncRequest之后会从同步点开始发出一批BinlogSyncResponse。

3，从库在收到BinlogSyncResponse之后，会在写入本地binlog之后再进行1流程。

同步模块:

Pika的同步由ReplicaManager(RM)模块负责。RM中有两层结构，逻辑层负责同步逻辑，传输层负责链接的管理数据的解析和传输。

数据的同步的最小单位是Partition，每一个Pika实例会维护自己作为主的partition(MasterPartition)和自己是从的partition(SlavePartition)。对于MasterPartition，需要记录跟随自己的slave同步信息，逻辑层会根据该信息向slave同步信息。对于SlavePartition，则是需要需要记录master的信息，逻辑层会按照该信息按需向master发送同步请求。

逻辑层维护两个数据结构，一个是MasterPartitions，记录跟随自己的SlaveNode信息，主要包括slave的同步状态和当前的sessionId。另一个是SlavePartitions，记录主的信息。

传输层分为两个子模块，ReplicationClient负责发起链接的建立，ReplicationServer负责响应报文。每两个实例之间的所有partition复用一条链接。

同步过程:

MasterPartition 同步事件

逻辑层处理MasterPartition的同步事件，向其对应的从同步数据。

1，读取MasterPartition Binlog信息后，将BinlogOffsetInfo记录到SlaveNode自己的window中。

2，将Binlog暂存到临时的待发送队列中。

3，辅助线程(Auxiliary thread) 定时将临时待发送队列的数据通过RM的传输层发送给对应的slave节点。

4，收到slave的BinlogSyncResponse之后，得知slave收到的BinlogOffset信息，更新SlaveNode window，重复1流程继续同步

为了控制每个SlaveNode同步的速度，避免某几个SlaveNode占用过多资源，为每一个SlaveNode设置了window。如下图所示，Pika收到了BinlogOffset为100到200的ack response，从window中移除BinlogOffset位于100到200的元素，之后继续发送BinlogOffset为1100和1200的binlog，对应的BinlogOffset添加至window中。

SlavePartition 同步事件

逻辑层处理SlavePartition的同步事件，收到master发送的同步数据，向master发相应的response信息。

1，按照解析出的Partition信息，被分配到对应的线程处理binlog写入任务。

2，线程写入binlog之后，调用传输层发送BinlogSyncResponse信息。

3，根据binlog的key分配给对应的线程处理写入db任务。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

sync.md

sync.md

全量同步

背景

1.Pika Replicate

2.Binlog

全同步

1. 简介

2. 实现逻辑

3. Slave连接状态

增量同步

背景：

Binlog 结构：

交互过程：

同步模块:

同步过程:

MasterPartition 同步事件

SlavePartition 同步事件

Files

sync.md

Latest commit

History

sync.md

File metadata and controls

全量同步

背景

1.Pika Replicate

2.Binlog

全同步

1. 简介

2. 实现逻辑

3. Slave连接状态

增量同步

背景 ：

Binlog 结构：

交互过程：

同步模块:

同步过程:

MasterPartition 同步事件

SlavePartition 同步事件

背景：