缓存与数据库双写一致性

发表于 2021-06-21 15:37:42 更新于 2021-06-22 15:54:34 分类于 redis 阅读次数：

本文字数： 1.4k 阅读时长 ≈ 1 分钟

介绍

缓存由于其高并发和高性能的特性，已经在项目中被广泛使用。在缓存的使用中，通常会面临一个更新的问题，当数据源产生变化，如何去更新到数据库与缓存之中，并且尽量保证安全与性能。

读缓存的情况一般包括下面几种情况：

读的地方没有争议，都是先读缓存，没有则取数据库数据，并写入缓存，但是写的地方就有了争议。

这种情况一般不考虑使用，在多线程情况下，会有线程安全问题。如：

正常情况下，A线程先更新的数据库，也应该先更新缓存，但是因为网络等原因，导致A更新缓存晚于B更新缓存，这种会导致数据库与缓存不一致，存在脏数据。

这种模式在一个写线程和一个读线程到来时也会发生线程安全问题，造成脏数据。

这种情况下，缓存的就是旧数据，而数据库则是新数据，造成脏数据，如果不设置缓存过期策略，这些数据就会成永久脏数据。
对于这种，一般采用延时双删的办法，就是在更新数据库后，过一段时间后在删除一次数据库。流程基本就是：

先删除缓存
在更新数据库
休眠一段时间，在删除缓存，将休眠时间内的脏数据删除
这个一段时间，一般需要指定为，读数据业务逻辑加一点点，就是稍大于读业务逻辑，在读写分离架构中，这个时间还需要加上主从同步时间。

这种主要会是有线程，在删除缓存后，和操作数据库的间隙中，进行读操作，而写数据库时，会有写锁无法读取，所以，等待一次读的时间，足够将间隙读操作造成的脏数据清理掉。
这种同步双删的策略，会导致吞吐量降低，毕竟改了库，一定会等待一段时间，可以重启一个线程，异步进行第二次删除。

这种模式一般比较常用，也是facebook的策略。
这种模式在模拟情况下，一样会有并发问题，但实际上可以忽略不记。

这种情况只有在数据的读速度慢于写速度的情况下才会发生，这种一般不会发生。即使发生也可以用延时双删策略进行保证一致性。

上面两种策略，删除缓存失败了，或者延时双删，第二次失败，都会产生脏数据。
通过一个保障重试的机制来重试删除缓存。可以将需要删除的key放入消息队列中，利用消息队列的失败机制进行重试。