高可用方案

单机部署

单机模式的 redis 非常简单,你只需要启动一个单一的节点就可以了,安装过程不超过 5 分钟。
通过 redis-benchmark 测试简单的命令,QPS 可达到 10w 以上,不得不说非常的让人惊艳了。
单机模式的问题也非常明显。缺乏高可用的机制!
假如 redis 进程死了,进程就只能够穿透到底层的数据库中,对业务来说非常的危险。如果你把 redis 当作数据存储来用,情况会更加严重,甚至会丢失数据。


主从复制

所以最基本的 redis 部署,都会增加一个或者多个 slave(现在叫 replication)。
当主 redis 发生问题的时候,能够选取一个 slave 顶上去。
非常可惜的是,这种模式和传统的 MySQL 主从一样,切换起来比较蛋疼,需要借助外部的工具,比如keepalived等辅助进行切换,部署和维护难度直接飙。
keepalived 是一个基于 vrrp 协议来实现的高可用方案,通过 IP 漂移实现高可用。从描述上就可以看出它需要网络管理员的参与,和我们轻量级的 redis 背道而驰。


哨兵机制

哨兵模式就是使用额外的进程来替换 keepalived 的功能,对 redis 进程的存活性进行判断。在哨兵模式下,一旦主节点宕机,从节点作为主节点的备份可以随时顶上来。
但哨兵模式一个最大的问题,就是哨兵的数量太多,至少需要 3 个节点。
对 redis 进行仲裁的时候,需要 n/2+1 个节点投票才能确认,这也是分布式系统的一般做法 (quorum)。和 Zookeeper 类似,哨兵节点做成奇数个,是非常合适的。
哨兵模式可以通过 sentinal moniter 配置同时检测多套集群,在集群数量适中的时候,还是比较好用的。
但哨兵模式有很多隐藏的坑,比如哨兵的启动,必须在 master 存活的情况下才能正常运行;另外,如果你的 redis 配置文件中使用 rename 屏蔽了一些危险命令时,哨兵也不能够启动。
客户端在连接 redis 的时候,就不能再直接连接 redis 的实例,它需要从哨兵转上一圈,以便获取一些变更信息。


集群模式

集群模式可以说是这里面最优雅的方式了。你只需要部署多个对等的 redis 节点,然后使用客户端命令进行组群就可以了。

1
2
3
ip=192.169.0.23
./bin/redis-cli --cluster create $ip:7001 $ip:7002 $ip:7003 $ip:7004 $ip:7005 $ip:7006 --cluster-replicas 1
复制代码

它对节点的要求也是比较多的,一般是采用 6 个节点,三主三从。当节点超过 10 个,它的协调性就不那么灵活了,所以单集群的存储和性能上限也很快能到达。
集群模式的一些缺点很隐蔽。它的服务端节点倒是非常稳定了,但有些命令会严重影响性能。比如 mget,pipeline 等。它们需要把请求分散到多个节点执行、再聚合。节点越多,性能越低。