AWS 数据容灾白皮书(AWS Disaster Recovery Whitepaper)剖析
《AWS 数据容灾白皮书(AWS Disaster Recovery Whitepaper)剖析》要点: AWS Disaster Recovery Whitepaper最近在做一个容灾方案,了解到AWS有一个容灾的白皮书. 容灾两个术语白皮书中提到了两个关于容灾的术语( industry terms)[2]
恕我孤陋寡闻,之前也参与过容灾的设计,但是关于这两个术语还是第一次知道. 1. RTO 恢复耗时主站点故障后,备站点恢复到达到OLA(operational level agreement )所耗费的时间. 举个例子,如果主站点在12:00 故障了,系统容灾的RTO时8小时,那么系统必须在20:00前恢复并正常提供服务. 2. RPO 恢复时间点主站点故障后,备站点能够恢复到过去哪个时间点的数据. 举个例子,如果主站点在12:00故障了,系统容灾的RPO是1小时,那么系统恢复后,其数据必须是到11:00的.也就是说允许丢失12:00~11:00 之间的数据. 所以以后在评判或设计一个容灾方案时候,先问这两个问题:
如果回答不上来,那么这个方案肯定是没想明白的. 容灾方案白皮书中将容灾方案按照RTO以及成本排序,称为容灾方案图谱. Backup and Restore备份恢复是最常见的一种容灾手段,将主站点数据备份到与主站点隔离的存储设备.当生产环境故障后,能够在备站点将数据恢复. AWS提供了一系列的高可靠存储服务:
使用Amazon的这些存储服务,加上备份恢复工具,就可以实现一个容灾系统. 备份示意图 恢复示意图 Pilot LightPilot Light 是一个装置,这个是一个类似点火器的装置,如煤气灶的点火器,通过点火器可以把煤气灶点燃,然后就可以做饭了:) Pilot Light用到容灾系统中,要表达的意思是,在备站点部署一个服务,通过这个服务可以将整个系统运行起来. 准备
恢复
Warm StandbyWarm Standby 是在备站点复制了主站点,但是它们还是有差别的:
准备
恢复
Multi SiteMulti Site 指的是 active-active 的容灾方案. 准备
恢复
Fail Back(编辑:ASP站长网) |