技术频道

计算机系统容灾方案

需求分析:
计算机系统灾难的发生是多方面的,从计算机数据管理的角度看,小到操作人员的误操作导致系统的破坏、数据库的丢失;中到计算机硬盘的损坏、存储介质的损坏;大到非计算机系统因素如火灾、地震、水灾等等。保持业务的持续性是当今用户进行数据存储需要考虑的一个重要方面。采取远程的数据灾难恢复手段,能够提高系统的高可靠性,真正保护业务持续性。

容灾包括数据容灾和应用容灾两类。数据容灾是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的数据。应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份)。建立这样一个系统是相对比较复杂的,不仅需要一份可用的数据复制,还要有包括网络、主机、应用、甚至IP等资源,以及各资源之间的良好协调。

方案简介:
下图为方案拓扑:


按此在新窗口浏览图片
主数据中心采用高可靠性集群解决方案设计,备份数据中心与主数据中心通过DDN/VPN相连接,当使用远程镜像时需要使用光纤连接两地光存储设备。主数据中心系统配置主机包括两台或多台服务器以及其他相关服务器,通过安装HA软件组成多机高可靠性环境。数据存储在主数据中心存储磁盘阵列中。同时,在异地备份数据中心配置相同结构的存储磁盘阵列和一台或多台备份服务器。通过专用的灾难恢复软件可以自动实现主数据中心存储数据与备份数据中心数据的实时完全备份。在主数据中心,按照用户要求,还可以配置磁带备份服务器,用来安装备份软件和磁带库。备份服务器直接连接到存储阵列和磁带库,控制系统的日常数据的磁带备份。


方案详解:
全面的异地容灾保护方案,意味着除了要实现本地的切换保护外,更要实现数据的实时异地复制和业务系统(包括数据库和应用软件)的实时远程切换。一个完整的容灾系统应该具有丰富的层次构造:

本地系统应用容灾
本地系统必须保证建立高可用性系统,保证无论是硬件还是软件出现问题候均可以有相关的资源接替,且此过程应对用户透明。可采用Veritas公司的Veritas Cluster Server(VCS)产品来实现,当发生应用或服务器故障时,VCS自动在集群内的另一部服务器恢复一个或多个应用。除此之外,VCS能够在异构环境(Solaris、Windows、AIX、HP-UX和Linux)下有效管理广泛系列的应用(标准和企业应用)。既支持存域网(SAN)多达32个节点(其中16节点面向AIX和Linux),又支持传统的客户机/服务器环境,具有提供全方位保护的功能性和灵活性,从单一关键数据库实例,到网络存储环境的超大型多应用集群。

本地系统数据容灾
系统中最重要的部分就是数据,在出现意外时,必须保证数据可以快速恢复且无数据损失,尽可能小的减少对业务运营的影响。而且,在平时的备份过程中,不可过多增加操作系统的负荷。建议采用Veritas NetBackup™ 、Veritas Backup Exe c™ (for Windows)产品。Veritas NetBackup能够保护每一种开放系统的操作环境,不需要通过很多站点或使用许多工具,就可以管理复杂的数据环境。除此之外,NetBackup还能够简化数据库备份与恢复等操作。Veritas Backup Exe c for Windows Servers是Windows数据保护领域的领先者和新一代备份与恢复解决方案.图形用户环境把产品操作整合于一个类似浏览器的视图内,由于整合了最完善的代理和选件系列,因此Backup Exe c能够为快速、可靠地保护数据,提供所需的易用性、高性能和灵活性。

远程数据容灾
在本地发生不可预料的如火灾、爆炸、地震、水灾、雷击或某个方向线路故障等自然原因以及电源机器故障、人为破坏等非自然原因引起的灾难,导致业务正常无法进行和重要数据的丢失、破坏,造成的损失将不可估量。为了防止这种情况,必须保证系统除在本地外,在异地也应该有一个完整的数据备份。建议使用Veritas Volume ManagerTM在线方式配置、共享、管理和优化存储I/O性能,在实现灾难恢复时,可以通过存域网(SAN)执行数据镜像,以满足城域灾难恢复解决方案的需求。Veritas FlashSanp可以在主要站点和辅助站点使用,是一种灵活易用的时间点拷贝方案。而Veritas Volume ReplicatorTM能够在更远的地理位置,通过任何IP网络,以可靠、有效、一致的方式,把数据镜像到远程站点。Veritas Storage ReplicatorTM面向Windows的产品,可提供实时数据复制保护远程办公室数据的能力。

远程应用容灾
如果本地因为不可抗力造成系统完全瘫痪,为了保证业务的连续性,可采用切换到远端系统的方式。可采用Veritas Global Cluster ManagerTM,其灾难恢复选件能够把数据复制到远程站点,从而允许实现站点和/或应用迁移,使计划内和计划外停机时间减至最小。


方案特点:
本方案是一个完整的容本地容灾、数据远程复制和远程容灾切换于一体的方案。以下说明本方案的特点及优势。

本方案能够支持手动/自动容灾方案,用户可以根据实际需要进行自由选择。
当本地主系统恢复正常后,需要进行反向数据同步、应用切换等工作,该工作需要由操作人员在系统较空闲时进行。工作过程很简单。
通过复制记录严格的按写顺序传送、双收条确认、反向切换时的重置等技术的使用,本方案可以最大限度地保证主、备节点的数据一致性。
本方案支持 1+1、N+1和节点互备方式,满足用户的不同需求。
本方案如果不考虑带宽,节点间没有距离的限制。由于数据复制的数据传递是基于卷的,所以每次传送的数据量基本就是每次系统I/O的数据大小。这样可以得到最大的带宽利用率。
基线建立,需要主备节点的数据完全同步。完全同步在应用运行期间也可以完成。可以采用自动同步方式或使用备份和检查点(Check Point)结合的方法。


成功案例:
无论是中小企业的简单应用还是大型公司的核心业务,此方案均可以为其在容灾方面提供帮助,可以有效的帮助用户减少计划内和计划外的停机时间。其在政府部门、电信、电力、保险、金融、大型门户网站等诸多行业都有着广泛应用,其典型应用如:北京公安局出入境管理处数据保护和容灾系统、中华网的存储解决方案、IncomnetTM通信公司非交换电信服务等。

文章版权归西部工控xbgk所有,未经许可不得转载。