Windows 故障转移群集 Part 1

Windows 故障转移群集 Part 1,第1张

对于现如今的IT运维来说,数据中心的应用和服务的高可用是重中之重,计划内或意外的宕机导致的业务停顿会直接造成经济损失,降低客户满意度进而破坏业内口碑,其重要性不言而喻。

高可用的系统要求部署可靠容错机制和运维手段,以便在出现单点故障时能及时检测并尽量降低业务中断时长,故障群集即为此目的应运而生。

在部署Windows Server 2012 R2故障转移群集之前,我们需要充分考虑集群所需的必要组件以便我们能够顺利的配置它。

集群仲裁 Quorum )用于定义当集群中至少有多少节点参与集群才能保证故障转移保护正常工作,每个节点都进行投票,票数满足仲裁设定则仲裁才可以开始或继续运行。当集群的节点数为偶数时,可以将集群配置为允许磁盘或者共享文件夹来作为见证( Witness )参与投票。为保证集群功能与性能正常,每个节点复制有包含投票数量的集群配置信息并会同步更新。

Windows Server 2012中,安装故障转移集群时,安装向导会自动选择默认仲裁模式,一旦集群安装完成,仲裁模式将被配置为如下两者之一,仲裁模式可在集群an'zhuang'wan'cheng'hou

从Windows Server 2012 R2 起,windows故障转移集群引入动态仲裁。在集群安装完成时,将默认使用动态仲裁模式。所谓动态仲裁模式,集群服务会根据集群中的节点数量动态修改集群仲裁模式,若节点数变为偶数,将启用磁盘见证( Witness ),使用节点磁盘多数仲裁;若节点数位奇数,将自动禁止磁盘见证( Witness )投票,使用节点多数仲裁,简而言之,动态仲裁会在节点故障时重新计算仲裁进而改变仲裁配置并保证集群正常提供服务。动态仲裁模式下,当新增或驱逐节点时,不需要手动配置仲裁模式。

Windows Server 2012 R2 还引入了强制仲裁d性功能( force quorum resilience ),此功能被用在集群被拆分,集群节点互相无法感知的情况下,即脑裂( Split Brain )场景。用以强制使服务可用。

本例使用Window Server 2012 R2 搭建iSCSI存储

准备Target

转自:集群故障转移的仲裁

Windows服务器故障转移集群(Windows Server Failover Cluster,简称WSFC)使用仲裁投票(Quorum Voting)决定集群的健康状况,或使故障自动转移,或使集群离线。 当集群中的结点发生故障时,会由其他结点接手继续提供服务 ,不过, 当结点之间通信出现问题,或大多数结点发生故障时,集群就会停止服务,可是集群可以容忍多少个结点发生故障呢? 这要由仲裁配置(Quorum Configuration)决定,仲裁配置采用少数服从多数(Majority)原则,只要集群中健康运行的结点数量达到仲裁规定的数量(多数结点投赞成票),集群就会继续提供服务,否则集群就停止提供服务。在停止提供服务期间,正常结点持续监控故障结点是否恢复正常,一旦正常结点的数量恢复到仲裁规定的数量,集群就恢复正常,继续提供服务。仲裁投票默认是启用的(Cluster Manged Voting:Enable)。

一,仲裁模式

仲裁模式是在WSFC 集群级别配置的,规定仲裁投票的方法,默认情况下,故障转移集群管理器会基于集群结点的数量,自动推荐一个仲裁模式。仲裁配置影响集群的可用性,在集群中,重组的集群结点必须在线,否则集群将由于仲裁不足而必须停止服务。

1,术语解释

仲裁(Quorum):法定数量,预先规定具有投票权的结点或见证(Witness)的数量;

仲裁投票(Quorum Voting)指法定数量的结点和见证进行投票,如果多数投赞成票,那么判断集群处于健康状态;

投票节点(Voting Node):在集群中,拥有投票权的结点称作投票结点,如果投票结点投赞成票,代表该结点认为集群是健康的;但是,单个结点不能决定集群整体的健康状态。

投票见证(Voting Witness):除了投票结点能够进行投票之外,共享的 File 和 Disk 也能投票,称作投票见证, 共享的File 投票见证,称作文件共享见证(File Share Witness);共享的Disk 投票见证,称作硬盘见证(Disk Witness) ;

仲裁结点集合(Quorum Node Set):拥有投票的结点和Witness统称仲裁结点集合;由仲裁结点集合的投票结果决定集群整体的健康状态。

2,仲裁模式

仲裁模式多数原则 是指所有投票结点进行投票,如果赞成票占比在50%以上,那么WSFC认为集群处于健康状态,执行故障转移,继续提供服务,否则,WSFC认为集群出现严重故障,WSFC使集群离线,停止提供服务。根据仲裁结点集合的组成类型,将仲裁模式分为以下四种类型:

结点多数 (Node Majority):在集群中,投票结点都是集群的结点服务器,如果一半以上的投票结点(Voting Node)投赞成票,那么WSFC判定集群是健康的;

结点和文件共享多数 (Node and File Share Majority):和Node Majority模式相似,除了将远程文件共享配置为一个投票见证(Voting Witness)之外,该共享文件称作仲裁文件,或见证文件。使用仲裁文件,远程文件拥有投票权,如果其他结点能够连接到该共享文件,那么认为该文件投一个赞成票。如果投票结点和文件共享投的赞成票占一半以上,那么WSFC判定集群是健康的。作为一个最佳实践,文件共享见证(File Share Witness)不要存储在集群中的任何一个结点服务器上,并且设置任何一个结点服务器都有权限访问。

结点和硬盘多数 (Node and Disk Majority):和Node Majority模式相似,除了将共享硬盘配置为一个投票见证(Voting Witness)之外,该共享硬盘称作仲裁硬盘,或见证硬盘。仲裁硬盘需要共享存储,集群中各个结点都需要挂载同一个共享硬盘。

只硬盘(Disk Only) :没有多数,仅仅把一个共享的硬盘作为唯一见证,集群中的任何一个结点能够访问该共享硬盘,这意味着,一旦仲裁硬盘脱机,集群就会停止提供服务。

常见的仲裁模式是结点多数(Node Majority) 和 结点和文件共享多数(Node and File Share Majority) ,如果集群结点数量是 奇数 ,那么使用结点多数仲裁模式;如果集群结点数量是 偶数 ,那么使用结点和文件共享多数仲裁模式,该模式需要配置一个共享文件夹,集群中的各个结点都有权限访问该共享文件夹,并且该共享文件夹不能创建是集群的结点上。

打开故障转移管理器(Failover Cluster Manager),右击集群结点,在上下文菜单中点击“More Actions”,在扩展菜单中选择“Configure Cluster Quorum Settings”,打开仲裁配置向导(Wizard),为该集群配置仲裁。

在任何时刻,从每一个的结点的角度来看,其他结点可能处于离线状态,或正在进行故障转移,或由于网络连接失败而处于不响应状态,仲裁投票的关键在于确定所有投票结点的真实状态。除了“Disk Only”仲裁模式之外,其他仲裁模式都依赖于投票结点之间周期性的心跳信号通信,一旦某个结点因为网络通信故障,系统宕机,硬件损坏,机房停电等异常而无法回应心跳信号,那么剩余的结点就认为该结点出现异常,把该结点从当前集群排除。WSFC统计所有投票结点的仲裁结果,决定集群的健康状态。

如果集群的结点位于不同的子网(Subnet)中,当一个结点在子网1中被认为是故障结点时,实际上,该结点可能是由于网络通信故障而不能被子网1的结点感知,但是该结点在子网2中是在线的,健康的 。如果投票结点在不同的子网中能够建立多个投票仲裁,那么将产生脑裂场景。在该场景中,位于不同仲裁的结点有不同的表现,使仲裁产生冲突,WSFC不能正确的执行故障转移,可能产生数据不同步。脑裂场景只可能在系统管理员手动执行强制仲裁(Forced  Quorum) *** 作时发生。

WSFC在集群的结点之间进行健康检测和仲裁投票,每一个结点通过周期性地发送心跳信号,检测其他其他结点的健康状态,并和其他结点共享健康数据,无法响应心跳信号的结点被认为处于异常状态,集群的所有健康结点都会很快知道该结点出现故障。

仲裁结点集合是投票结点和见证结点(Witness)结合,仲裁结果由多数(Majority)结点决定,集群整体的健康状态是由周期性的仲裁投票的结果决定的,WSFC根据仲裁投票的结果,执行自动故障转移或者使集群离线:如果仲裁结点集合(Quorum Node Set)的投票结果表明大多数结点是健康的,那么集群将进行故障转移,继续提供服务;如果投票结果是少数结点,那么集群将处于离线状态。

可以断开,但会导致群集故障。

群集会按照仲裁原则来判定群集是否还能满足最低工作条件(2节点基本就是可以判定群集失效了,多节点还有可能剩下的多数节点继续工作,但已经不能实现高可用了),心跳线必须用一块网卡,不能与服务使用的网卡共用的,所以做群集每个机器至少2块网卡。

扩展资料:

当集群中的一个系统发生故障时,集群软件迅速做出反应,将该系统的任务分配到集群中其它正在工作的系统上执行。考虑到计算机硬件和软件的易错性,高可用性集群的主要目的是为了使集群的整体服务尽可能可用。

如果高可用性集群中的主节点发生了故障,那么这段时间内将由次节点代替它。次节点通常是主节点的镜像。当它代替主节点时,它可以完全接管其身份,因此使系统环境对于用户是一致的。

参加资料来源:百度百科-群集技术


欢迎分享,转载请注明来源:内存溢出

原文地址: http://www.outofmemory.cn/bake/11604033.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存