咨询热线:010-82194011

当前位置:首页 > 解决方案 > 存储高可用存储高可用
NetApp统一存储双活方案

1、双活存储架构建设目标

系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间(不可忍受)的事故。可能引发系统灾难的因素包括:

·          系统软、硬件故障,如:软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等;

·          机房环境突发性事故,如:电源中断、建筑物倒塌、机房内火灾等;

·          人为因素,如:因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等;

·          自然灾害:如火灾、地震、洪水等突发而且极具破坏性的事故。其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下,计算中心机房的硬件设备会部分或完全损坏,造成业务的停顿。

请参见下图:

当前用户IT系统缺乏有效的灾难防范手段,难以在灾难发生后,不间断或者迅速地恢复运行。灾难恢复就是在IT系统发生系统灾难后,为降低灾难发生后造成的损失,重新组织系统运行,从而保证业务连续性。其目标包括

l  保护数据的完整性、一致性,使业务数据损失减少;

l  快速恢复业务系统运行,保持业务的连续性。

灾难恢复的目标一般采用RPORTO两个指标衡量。

技术指标RPORTO

RPO (Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。即在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在半同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,同步模式下,RPO一般为0,而在非同步模式下,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性是不相同的,RPO表示业务数据与容灾备份数据的时间差。换句话说,发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。

RTO (Recovery Time Objective):即应用的恢复时间目标。RTO主要指的是所能容忍的应用停止服务的时间,也是是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有小的RTO。容灾系统为获得小的RTO,需要投入大量资金。

2、双活数据中心的价值和特点

双活数据中心有以下特点和优势:

l 双活数据中心,实际上是跨数据中心的高可用。细分到单个组件看,形成了跨数据中心的主机高可用、网络高可用和存储高可用,实现的是跨数据中心的应用高可用。

l 双活数据中心具有“故障自愈”的特点,不需要人为干预,发生故障后,应用自动转移到可以正常运行的部分。而应用的运行不会受到影响。即RPO = 0RTO = 0

l 不同于容灾技术中“主中心-备中心”的主备概念,双活数据中心具有“双活”的特点,也就是说,业务可以分担到两个数据中心,同时运行,互为备份。相对于同步容灾,灾备中心设备往往处于空转状态,双活数据中心中的所有硬件资源都得到了重复的利用,避免了投资上的浪费,而网络要求完全是一样的。因此,双活技术不但降低了成本,而且增加了效率。

l 不同于普通数据备份恢复方案,普通数据备份和恢复(例如:Symantec Backup Exec)是将目标数据以备份软件的方式和格式通过以太网或SAN网络备份到指定存储设备中,当灾难发生时需要人工干预进行数据恢复,恢复到新设备中的数据才可以进行使用,这样就增加了RTO的目标,并且数据量越大RTO越大。并且备份的数据不可以直接拿来使用,需要恢复后才可以让应用或者其他平台正常使用。

l 双活数据中心的常见架构如下:


l 两中心之间为双活互备工作模式

注:双活存储也可部署在同机房,在这种情况下,双活架构对机房整体故障不具备防范能力。


点击直达产品介绍!

NetApp FAS8040