VMware vSphere服务器虚拟化实验九高可用性之一HA群集

高可用性(HA)和双机热备(FT)是VMware vSphere 5.1最重要的一部分,高可用并不是vSphere独有的,企业使用高可用就是为了服务的连续性和数据的安全性,HA是以一组ESXi服务器为主的群集功能,主要是目的是当虚拟机运行的主机发生故障时能及时转移主机,避免长时间的停机。而FT双机热备则是保证虚拟机最长时间不停机,将虚拟机以双机热备的方式同时在两台主机运行,大大增强了业务的可连续性。

在VMware vSphere环境中高可用性和双机热备是基于群集实现的。群集是由多台ESXi主机组成的集合,并将这个集合内所有ESXi主机的资源进行池化,所有的虚拟机可在池中的任意主机上自由移动注意集群内的主机必须要有共享存储并且所有虚拟机及其配置文件都驻留在共享存储器上。群集的目的就是将计算机的负担分配到多台主机上,或是当运行某一个服务的物理服务器出现故障时,这台服务器上运行的虚拟机自动迁移到其他可用的ESXi服务器上,从而保障业务的不间断运行。

VMware vSphere集群功能分为三种:

A.          HA群集:高可用性,无需在应用程序或虚拟机内安装特殊软件,所有工作负载均受Sphere HA 保护,当监控到集群中有主机意外故障时,会自动在其他主机上启动故障主机上之前承载的虚拟机。在创建 vSphere HA 群集时,会自动选择一台主机作为首选主机。首选主机可与 vCenter Server 进行通信,并监控所有受保护的虚拟机以及从属主机的状态。可能会发生不同类型的主机故障,首选主机必须检测并相应地处理故障。首选主机必须可以区分故障主机与处于网络分区中或已与网络隔离的主机。首选主机使用网络和数据存储检测信号来确定故障的类型。

B.    DRS群集:分布式资源调度,用于动态调整集群中ESX主机负载,自动把负载较重的主机上的虚拟机通过VMotion迁移到负载较轻的主机上,最终达到整个集群中的主机资源消耗平衡。

C.          DPM群集:分布式电源管理,用于在负载较轻时,把虚拟机动态“集中”到集群中的少部分主机上,然后把其他ESX/ESXi主机待机,以节省电力消耗,等负载较大时,再重新唤醒之前待机的主机

说明:

      环境基于实验八,本次实验主要创建HA群集

1打开VMware vSphere Client 管理控制台然后创建群集名为Cluster,启用增强型vMotion兼容性 (EVC),并选择它应以何种模式运行,是 AMD还是Inter的CPU类型。但是即便使用EVC,也不能将Intel服务器上的虚机迁移到AMD主机上

2把两台ESXi主机加入到群集当中(注意群集中的主机的网络配置要相同和硬件最好一样,还要有共享存储)

3 确认每台ESXi主机都有管理网络冗余,并且vSphere HA检测信号数据存储数目为1,少数要求数目为2。如果不满足其要求,则会在配置HA的过程中提示配置问题。所有虚拟机及其配置文件都驻留在共享存储器上。确认主机配置为具有该共享存储器的访问权限,以便可以使用群集中的不同主机打开虚拟机电源。

4编辑Cluster群集的属性开启HA功能,然后设置主机监控状态、虚拟机选项、虚拟机监控和数据存储检测信号等功能,完成HA群集设定。

A.    主机监控:监控群集主机间的网络信号,设定接入控制规定虚拟机故障切换预留的群集容量数,还有设定接入控制策略。

B.    虚拟机选项:设置控制虚拟机的重新启动顺序(虚拟机重新启动优先级)以及在主机之间失去网络连接时 vSphere HA 的响应方式(主机隔离响应)。这些设置适用于主机发生故障或主机隔离时群集内的所有虚拟机。此外,也可以为特定虚拟机配置异常。如果在设置的时间内没有收到单个虚拟机的 VMware Tools 检测信号,虚拟机监控将重新启动该虚拟机。同样,如果没有收到虚拟机正在运行的应用程序的检测信号,应用程序监控也可以重新启动该虚拟机。可以启用虚拟机监控功能,并配置 vSphere HA 监控无响应时
的敏感度。在默认群集设置里可以配置监控敏感度的级别。高敏感度监控可以更快得出已发生故障的结论。然而,如果受监控的虚拟机或应用程序实际上仍在运行,但由于资源限制等因素导致未收到检测信号,高敏感度监控可能会错误地认为此虚拟机发生了故障。低敏感度监控会延长实际故障和虚拟机重置之间服务中断的时间。检测到故障后,vSphere HA 会重置虚拟机。重置可确保这些服务仍然可用。为了避免因非瞬态错误而反复重置虚拟机,默认情况下,在某个可配置的时间间隔内将对虚拟机仅重置三次。在对虚拟机执行过三次重置后,指定的时间结束之前,vSphere HA 不会在后续故障出现后进一步尝试重置虚拟机。可以使用每个虚拟机的最大重置次数自定义设置来配置重置次数。监控灵敏度高时,故障时间间隔30(秒),重置期为1 小时。监控灵敏度中时,故障时间间隔60(秒),重置期为24小时。监控灵敏度低时,故障时间间隔120(秒),重置期为7天,在默认群集设置中,左右调整按钮来控制监控灵敏度

C.    数据存储检测信号:当 vSphere HA 群集中的首选主机无法通过管理网络与从属主机通信时,首选主机将使用数据存储检测信号来确定从属主机是否出现故障,是否位于网络分区中,或者是否与网络隔离。vCenter Server 为每个主机选择的检测信号数据存储的数量。

5测试HA高可用性,当设置完 vSphere HA 群集之后,群集内的所有虚拟机无需额外配置即可获得故障切换支持。由于Windows10保存在共享存储上,模拟ESXi2主机关机,测试windows10虚拟机能否迁移到ESXi1主机上并启动起来

视频分享:http://pan.baidu.com/share/link?shareid=2967693362&uk=1025659618

发表评论

电子邮件地址不会被公开。 必填项已用*标注