简述
这里的Consistency(一致性)是指分布式系统中的数据一致性,而非数据库事务ACID特性中的Consistency。
CAP
CAP(或称布鲁尔定理)指出一个分布式计算系统不可能同时满足以下三点:
- 一致性(Consistency):多个数据副本是否能够保持一致;
- 可用性(Availability):每次请求都能获取非错的响应,但无法保证获取的数据是否最新;
- 分区容忍性(Partition tolerance):网络分区指分布式系统中的各个节点,任意分区(节点)网络故障时,系统仍需要可以对外提供服务。
分布式系统不可能同时满足这三个特性,最多只能同时满足其中两项,分区容忍性必不可少,因为需要总是假设网络不是可靠的,所以最终要在可用性和一致性之间做选择。
BASE
可用性与一致性是冲突的,在多个节点之间进行数据同步时
- 为了保证一致性(CP),就需要让系统暂定服务,等待数据同步完成
- 为了保证可用性(AP),同步过程中继续提供服务,读取的数据可能不一致
BASE(Basically Available-基本可用,Soft State-软状态,Eventually Consistent-最终一致性)理论由来自eBay的架构师Dan Pritchett在其文章BASE: An Acid Alternative注 中第一次明确提出的,对可用性与一致性进行了权衡。核心思想:即使无法做到强一致性,但每个应用都可以根据自身业务特点,采用适当的方式来使系统达到最终一致性。
- 基本可用:分布式系统出现不可预知故障时,允许损失部分可用性(不等价于系统不可用)。如:正常情况下0.5秒做出响应,出现故障后响应时间增加了1~2秒;
- 软状态:系统中的数据处于中间状态,不影响系统整体可用性,允许不同节点间的数据同步过程存在延迟;
- 最终一致性:经过一段时间的同步后,所有节点最终的数据是一致的,不需要实时保证系统数据的强一致性。
算法
-
**Paxos:**非常经典的一致性算法,被认为是同类算法中最有效的,由莱斯利·兰伯特(Leslie Lamport)于1990年提出。The Part-Time Parliament 是该算法公开发表的第一篇论文,用了大量的数学证明,考虑到大多数人难以理解,Lamport又发表了一篇 Paxos Made Simple,使用逻辑推理重新论述了一遍;
-
**Raft:**一种易于理解的一致性算法,官方称在容错与性能方面与Paxos算法旗鼓相当。官方网站:The Raft Consensus Algorithm ,更多Raft的细节可以参考论文 In Search of an Understandable Consensus Algorithm(Extended Version);
参考资料
- CAP定理
- CAP 定理的含义
- Base: An Acid Alternative
- An Illustrated Proof of the CAP Theorem