赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 云备份
  4. 操作指南
  5. 容灾
  6. ECS容灾(云盘异步复制型)(公测中)
  7. 故障演练

故障演练

  • ECS容灾(云盘异步复制型)(公测中)
  • 发布于 2025-04-22
  • 0 次阅读
文档编辑
文档编辑

故障演练是整体容灾流程中极其重要的一环。 本文介绍ECS容灾中故障演练的操作流程。

故障演练的意义

故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:

  • 方便地验证被容灾保护的应用可以在容灾站点正常拉起。

  • 确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。

前提条件

  • 保护组处于增量复制中或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见跨可用区容灾启动复制和跨地域容灾启动复制。

  • 对于创建自定义演练环境场景,您需要提前创建演练环境所需的VPC网络、交换机映射和安全组映射等。

操作流程

  1. 创建故障演练环境。

    说明

    对于创建自定义演练环境场景,您需要提前创建演练环境所需的VPC网络、交换机映射和安全组映射等。并创建演练环境后,进行演练网络配置。

  2. 启动故障演练。

  3. 验证应用或业务。

  4. 清空演练环境。

选择创建演练环境的方式

创建方式

适用场景

优点

缺点

自动创建并启动

适用于业务比较独立,不需公网或者和其他网络通信的配置即可验证业务的场景。

说明

例如提供内部业务的ECS应用,业务不涉及配置负载均衡SLB、域名、安全组(开放端口)等。

  • 配置简单

指定保护组后,系统自动创建演练环境所需资源,包括VPC网络、交换机映射和安全组映射。

不可自定义演练后新创建的ECS实例名称的前缀。自定义的ECS实例名称有利于您快速识别故障演练ECS。

创建自定义演练环境

适合业务和其他网络有交互,需要额外的网络方面配置才可验证的场景。演练环境配置好以后可以一直保留。

说明

例如多台ECS通过负载均衡SLB对外提供服务的场景,您需要为业务配置负载均衡SLB、域名、安全组(开放端口)等。

  • 可以自定义演练后新创建的ECS实例名称的前缀,有利于您快速识别故障演练ECS。

  • 自行规划和创建演练环境资源。包括手动创建演练VPC或者选择容灾站点VPC,创建交换机、安全组映射等。

  • 配置复杂

您需要单独指定演练VPC、配置交换机映射、安全组映射,可能存在实例IP冲突,导致演练失败。

自动创建并启动故障演练

  1. 登录云备份Cloud Backup控制台。

  2. 在左侧导航栏,选择容灾 > ECS容灾。

  3. 如果不是云盘异步复制型容灾,请单击切换到云盘异步复制型容灾。image

  4. 在容灾站点对页面,单击目标容灾站点对,选择故障演练页签。

    说明

    您也可以进入对应保护组页签,在操作列选择故障演练操作。

  5. 单击自动创建并启动。

  6. 在启动演练对话框,从下拉框选择保护组,单击下一步。image.png

  7. 预览保护组资源,确认完成后,单击确认。image.png

    说明
    • 当容灾站点实例规格和实例操作系统不满足要求时,您可以根据生产站点ECS实例规格、操作系统和界面提示,选择合适的实例规格。您可以通过修改实例规格和修改操作系统修改容灾站点实例规格和操作系统。若规格族和操作系统无法满足您的需求,请提工单联系阿里云技术支持。

    • 启动容灾复制前,您也可以修改自定义数据和修改容灾端IP。

    • IP地址异常,是IP地址已被使用,请移除原演练ECS实例或在网络配置中更改交换机映射。

  8. 在确认启动演练对话框,单击确认,启动演练。image.png

    重要
    • 系统会暂停当前保护组复制状态,然后基于最近一次可恢复点创建出新的可用盘。通常情况下,暂停会在5分钟内自动恢复。演练磁盘就绪后,系统会在容灾站点创建出演练ECS实例,等演练组创建成功后即可开始验证业务。

    • 保护组演练会自动启动容灾端ECS且不会自动停止生产端ECS。请用户谨慎评估业务,并结合安全组、网络隔离等手段隔离生产流量,以避免业务风险。

    演练保护组状态会先后进入初始化、演练中、演练组创建成功状态。

    image.png

  9. 演练ECS实例启动成功后,您就可以验证业务。

    image.png

  10. 清理演练环境。

    1. 删除故障演练组

      删除故障演练组会删除演练过程中创建的ECS、云盘、弹性网卡、快照、镜像等资源。

      在目标演练保护组的操作列,单击删除故障演练组,完成确认,即可删除。

      说明

      您也可以进入对应保护组页签,在操作列删除指定故障演练组,可以批量删除故障演练组。

    2. 删除演练环境

      在演练环境区域,单击删除,完成确认,即可删除。

创建自定义演练环境

  1. 登录云备份Cloud Backup控制台。

  2. 在左侧导航栏,选择容灾 > ECS容灾。

  3. 如果不是云盘异步复制型容灾,请单击切换到云盘异步复制型容灾。image

  4. 在容灾站点对页面,单击目标容灾站点对,选择故障演练。

    说明

    您也可以进入对应保护组页签,在操作列选择故障演练操作。

  5. 单击创建自定义演练环境。

  6. 在创建演练环境对话框,设置故障演练后新创建ECS实例名称的前缀,从下拉框中选择演练VPC,然后单击确认。image.png

    说明
    • ECS实例前缀为新创建ECS实例名称的前缀。例如您容灾演练的ECS实例名称为ecse,ECS实例前缀取值为Drill_test_20230925_,则新生成的ECS实例名称为Drill_test_20230925_ecs。

    • 您需要提前在容灾站点创建演练环境所使用的VPC。

  7. 配置演练环境网络。image.png

    1. 在演练环境区域,单击演练网络配置参数后的详情。

    2. 在演练网络配置对话框,添加交换机映射和添加安全组映射。image.png

  8. 在演练环境区域,单击启动演练,开始故障演练。image.png

  9. 在启动演练对话框,从下拉框选择保护组,单击下一步。image.png

  10. 预览保护组资源,确认完成后,单击确认。image.png

    说明
    • 当容灾站点实例规格和实例操作系统不满足要求时,您可以根据生产站点ECS实例规格、操作系统和界面提示,选择合适的实例规格。您可以通过修改实例规格和修改操作系统修改容灾站点实例规格和操作系统。若规格族和操作系统无法满足您的需求,请提工单联系阿里云技术支持。

    • 启动容灾复制前,您也可以修改自定义数据和修改容灾端IP。

    • IP地址异常,是IP地址已被使用,请移除原演练ECS实例或在网络配置中更改交换机映射。

  11. 在确认启动演练对话框,单击确认,启动演练。image.png

    重要
    • 系统会暂停当前保护组复制状态,然后基于最近一次可恢复点创建出新的可用盘。通常情况下,暂停会在5分钟内自动恢复。演练磁盘就绪后,系统会在容灾站点创建出演练ECS实例,等演练组创建成功后即可开始验证业务。

    • 保护组演练会自动启动容灾端ECS且不会自动停止生产端ECS。请用户谨慎评估业务,并结合安全组、网络隔离等手段隔离生产流量,避免业务风险。

    演练保护组状态会先后进入初始化、演练中、演练组创建成功状态。

    image.png

  12. 演练ECS实例启动成功后,您就可以验证业务。image.png

  13. 清理演练环境。

    1. 删除故障演练组

      删除故障演练组会删除演练过程中创建的ECS、云盘、弹性网卡、快照、镜像等资源。

      在目标演练保护组的操作列,单击删除故障演练组,完成确认,即可删除。

      说明

      您也可以进入对应保护组页签,在操作列删除指定故障演练组,可以批量删除故障演练组。

    2. 删除演练环境

      在演练环境区域,单击删除,完成确认,即可删除。

相关文章

功能概览 2025-04-22 15:06

本文介绍云盘异步复制容灾,帮助您了解其基本能力和价值。 功能概述 云备份服务基于云盘异步复制技术实现跨地域或者跨可用区容灾能力,应对不同的业务需求。 该技术是在云盘层通过异步复制实现,无需在受保护的实例上安装代理。 当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障

使用限制 2025-04-22 15:06

本文介绍云备份服务云盘异步复制容灾的使用限制。 可用地域和可用区限制 公测期间地域逐步放开中,以创建站点对时可选地域为准。支持在以下地域及可用区使用异步复制功能: 华东1(杭州):可用

操作流程 2025-04-22 15:06

本文介绍使用云盘异步复制容灾的基本操作流程。 操作流程 在云备份服务控制台,实现对关键应用的容灾保护,主要步骤包括如下: 步骤一:资源规划。 进行容灾前,您需要提前规划容灾所需的计算、存储、网络等资源。例如服务器数量、存储容量、划分网络VPC等。

跨可用区容灾 2025-04-22 15:06

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的RTO、RPO核心指标。

跨地域容灾 2025-04-22 15:06

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。

历史任务 2025-04-22 15:06

本文介绍如何使用历史任务查看容灾保护时的任务状态。历史任务用于记录容灾的任务。查看历史任务的执行状态,有助于您了解容灾执行的结果,排查异常问题。 操作步骤

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号