Appearance
消息队列的高可用
1. RabbitMQ 的高可用
RabbitMQ 基于主从模式实现高可用。RabbitMQ 有三种模式:单机模式,普通集群模式,镜像集群模式。
1.1. 单机模式
单机模式就是 demo 级别的,生产中不会有人使用。
1.2. 普通集群模式
普通集群模式就是在多台机器上启动多个 RabbitMQ 实例,每个机器启动一个。但是创建的 queue 只会放在一个 RabbitMQ 实例上面,但是其他的实例都同步了这个 queue 的元数据。在你消费的时候,如果连接到了另一个实例,他会从拥有 queue 的那个实例获取消息然后再返回给你。
普通集群模式示意图:

这种方式并没有做到所谓消息的高可用,就是个普通的集群,这样还会导致要么消费者每次随机连接一个实例然后拉取数据,这样的话在实例之间会产生网络传输,增加系统开销,要么固定连接那个 queue 所在的实例消费,这样会导致单实例的性能瓶颈。
而且如果那个方 queue 的实例宕机了,会导致接下来其他实例都无法拉取数据;如果没有开启消息的持久化会丢失消息;就算开启了消息的持久化,消息不一定会丢,但是也要等这个实例恢复了,才可以继续拉取数据。
所以这个并没有提供高可用,这种方案只是提高了吞吐量,也就是让集群中多个节点来服务某个 queue 的读写操作。
1.3. 镜像集群模式
这种模式,才是 RabbitMQ 提供是真正的高可用模式,跟普通集群不一样的是,你创建的 queue,无论元数据还是 queue 里面是消息数据都存在多个实例当中,然后每次写消息到 queue 的时候,都会自动把消息发到多个 queue 里进行消息同步。
镜像集群模式示意图:

优点:
任何一台机器宕机了,其他的机器还可以使用。
缺点:
1、性能消耗太大,所有机器都要进行消息的同步,导致网络压力和消耗很大; 2、没有扩展性可言,如果有一个 queue 负载很重,就算加了机器,新增的机器还是包含了这个 queue 的所有数据,并没有办法扩展 queue;
如何开启镜像集群模式:在控制台新增一个镜像集群模式的策略,指定的时候可以要求数据同步到所有节点,也可以要求同步到指定节点,然后在创建 queue 的时候,应用这个策略,就会自动将数据同步到其他的节点上面去了。
2. Kafka 的高可用
Kafka 的一个基本架构:多个 broker 组成,一个 broker 是一个节点;你创建一个 topic,这个 topic 可以划分成多个 partition,每个 partition 可以存在于不同的 broker 上面,每个 partition 存放一部分数据。这是天然的分布式消息队列。
实际上 RabbitMQ 并不是分布式消息队列,他就是传统的消息队列,只不过提供了一些集群、HA 的机制而已,因为无论如何配置,RabbitMQ 一个 queue 的数据就存放在一个节点里面,镜像集群下,也是每个节点都放这个 queue 的全部数据。
Kafka 在 0.8 以前是没有 HA 机制的,也就是说任何一个 broker 宕机了,那个 broker 上的 partition 就丢了,没法读也没法写,没有什么高可用可言。
Kafka 在 0.8 之后,提过了 HA 机制,也就是 replica 副本机制。每个 partition 的数据都会同步到其他机器上,形成自己的 replica 副本。然后所有的 replica 副本会选举一个 leader 出来,那么生产者消费者都和这个 leader 打交道,其他的 replica 就是 follower。写的时候,leader 会把数据同步到所有 follower 上面去,读的时候直接从 leader 上面读取即可。
为什么只能读写 leader:因为要是你可以随意去读写每个 follower,那么就要关心数据一致性问题,系统复杂度太高,容易出问题。Kafka 会均匀度讲一个 partition 的所有数据 replica 分布在不同的机器上,这样就可以提高容错性。
这样就是高可用了,因为如果某个 broker 宕机 了,没事儿,那个 broker 的 partition 在其他机器上有副本,如果这上面有某个 partition 的 leader,那么此时会重新选举出一个现代 leader 出来,继续读写这个新的 leader 即可。
Kafka 高可用架构示意图:

写消息:写数据的时候,生产者就写 leader,然后 leader 将数据落到磁盘上之后,接着其他 follower 自己主动从 leader 来 pull 数据。一旦所有 follower 同步好了数据,就会发送 ack 个 leader,leader 收到了所有的 follower 的 ack 之后,就会返回写成功的消息给消息生产者。(这只是一种模式,可以调整)。
读数据:消费数据的时候,只会从 leader 进行消费。但是只有一个消息已经被所有 follower 都同步成功返回 ack 的时候,这个消息才会被消费者读到。