赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 云服务器 ECS
  4. 实践教程
  5. 稳定性最佳实践
  6. 故障演练
  7. 网络演练
  8. 网络丢包演练

网络丢包演练

  • 网络演练
  • 发布于 2025-04-01
  • 0 次阅读
文档编辑
文档编辑

网络丢包是一种常见的网络故障,网络拥塞、网络硬件故障、网络链路干扰等情况都可能会造成网络丢包,通过此演练场景验证系统在网络丢包时的告警和恢复情况。

使用限制

该演练场景需要使用tc(Traffic Control)工具及其依赖的内核netem组件。

  • 如系统缺少tc工具,请执行yum install -y iproute-tc或apt-get install -y iproute2安装,或者执行插件时指定相关参数自动安装。

  • 如系统内核缺少netem组件,如CentOS,可执行yum install kernel-modules-extra安装软件包并重启。

    警告

    注意安装kernel-modules-extra会修改内核版本,请谨慎操作,建议使用其他操作系统的ECS进行演练。

实现原理

本方案使用云助手插件ACS-ECS-NetLoss,使用tc(Traffic Control)工具和netem组件对网卡增加特定规则,实现对Linux内核流量控制。该插件可实现对全局IP或仅针对单个IP进行限制,其中云助手网段100.100.0.0/16不会受到影响。

使用指南

演练准备

请确保您的ECS实例已安装云助手Agent,并且云助手状态为正常。具体操作,请参见查看云助手状态及异常状态处理。

故障注入

  1. 登录ECS实例。

    具体操作,请参见使用Workbench工具以SSH协议登录Linux实例。

  2. 使用具有sudo访问权限的用户,运行云助手插件ACS-ECS-NetLoss。

    sudo acs-plugin-manager --exec --plugin ACS-ECS-NetLoss --params inject,dev=eth0,[rate=paramA],[target-ip=paramB],[replace=paramC],[duartion=paramD],[install-tc=paramF]

    []内为可选故障注入参数,参数说明:

    为可选故障注入参数,参数说明:

    • dev(必填):需要注入的网卡,如eth0,可使用ifconfig查看当前系统的网卡。

    • rate(可选):丢包比例,默认10(%)。

    • target-ip(可选):预期产生影响的目标IP,默认为空,表示对所有IP增加丢包规则,如指定目标IP,则只有该IP会受到影响。

    • replace(可选):如网卡已有设定的tc规则,注入时会产生冲突导致失败。如确定对原有规则进行覆盖,可指定值为true。

    • duartion(可选):持续时间,单位为s,默认为300。

    • install-tc(可选):如系统缺少tc工具,可指定该参数为true自动安装,默认false。

      显示如下所示时,说明云助手插件ACS-ECS-NetLoss执行成功。

      image

  3. 查看故障注入是否成功。

    通过ping目标网络,查看网络丢包情况,如下图所示,可以看到网络发生丢包,平均丢包约为44%。

    image

故障恢复

  • 方法一:等待超时自动恢复。

  • 方法二:执行故障恢复命令。

    sudo acs-plugin-manager --exec --plugin ACS-ECS-NetLoss --params recover
相关文章

网络丢包演练 2025-04-01 11:57

网络丢包是一种常见的网络故障,网络拥塞、网络硬件故障、网络链路干扰等情况都可能会造成网络丢包,通过此演练场景验证系统在网络丢包时的告警和恢复情况。 使用限制 该演练场景需要使用tc(Traffic Control)工具及其依赖的内核netem组件。

网络中断演练 2025-04-01 11:57

ECS所在网络故障是一种常见场景,如发生硬件链路异常,运营商网络波动,系统配置等,都会造成网络无法连接,对外表现为ECS长时间不可用。因此通过该场景验证业务在其中某个节点不可用时的监控和恢复能力。 实现原理 同网络丢包100%,即使用云助手插件

网络延迟演练 2025-04-01 11:57

网络延迟直接影响应用程序和服务的响应速度,过高的网络延迟会影响用户的使用体验。网络流量增大、线路不稳定等情况都会增加网络延迟。通过此演练场景验证系统在网络延迟时的告警和恢复情况。 使用限制 该演练场景需要使用tc(Traffic Control)工具及其依赖的内核netem组件。

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号