赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. ACK Serverless集群
  4. 操作指南
  5. 弹性伸缩
  6. AHPA弹性预测
  7. 弹性伸缩预测(AHPA)

弹性伸缩预测(AHPA)

  • AHPA弹性预测
  • 发布于 2025-04-18
  • 0 次阅读
文档编辑
文档编辑

在云原生场景下,资源容量通常难以预估,而Kubernetes原生HPA存在弹性滞后和配置复杂的问题。为此,ACK推出了AHPA(Advanced Horizontal Pod Autoscaler)弹性预测,支持根据业务历史指标,自动识别弹性周期并对容量进行预测,提前进行弹性规划,解决弹性滞后的问题。

背景信息

传统管理应用实例数有固定实例数、HPA和CronHPA三种方法。三种方法的缺点如下。

类型

缺点

固定实例数

资源浪费严重,在业务低谷时仍需要全量支付资源费用。

HPA

弹性触发滞后,只有达到业务洪峰才会触发弹性伸缩。

CronHPA

  • 需要设置每个时间段的实例数。实例数过多容易造成资源浪费;实例数过少无法满足实际需求。

  • 需要根据业务变化调整定时策略,易用性较差。

针对上述弹性方式存在的问题,ACK支持AHPA弹性预测功能,以提高资源利用率和易用性。AHPA弹性预测根据历史数据自动规划未来24小时每一分钟的应用实例数,相当于进行1440个点(一天为1440分钟)的CronHPA定时配置。如下图所示,左侧为传统HPA策略,右侧为有预测功能的HPA。

  • 传统HPA策略:在业务量上涨之后开始扩容,滞后的资源供给不能及时补充业务需求。

  • 有预测功能的HPA:根据历史Pod的Ready Time以及历史Metrics自动学习规律,在业务量上涨之前的一个Ready Time开始扩容。当业务量上涨时Pod已提前准备,可以及时提供资源。

image

业务架构

image
  • 丰富的数据指标:支持包括CPU、GPU、Memory、QPS、RT以及外部指标等。

  • 稳定性保障:AHPA的弹性逻辑基于主动预测、被动兜底的策略,并结合降级保护,保证了资源的稳定性。

    • 主动预测:根据历史指标预测出未来一段时间的趋势结果,适用于周期性的应用。

    • 被动预测:实时预测。针对突发流量场景,通过被动预测实时准备资源。

  • 降级保护:支持配置多个时间区间范围最大值和最小值。

  • 多种伸缩方式:AHPA支持伸缩方式包括Knative、HPA以及Deployment:

    • Knative:解决Serverless应用场景下,基于并发数、QPS或RT弹性冷启动的问题。

    • HPA:简化HPA弹性策略配置,降低用户使用弹性的门槛,解决使用HPA面临的弹性滞后问题。

    • Deployment:直接使用Deployment,自动扩缩容。

核心优势

  • 更快:毫秒级预测,秒级弹性。

  • 更准:复杂周期识别率95%以上,主动预测和被动预测相结合。

  • 更稳: 支持分钟级边界保护配置。

适用场景

  • 有明显周期性场景。例如直播、在线教育、游戏服务场景等。

  • 固定实例数+弹性兜底。例如常态业务下应对突发流量等。

  • 推荐实例数配置场景。提供标准K8s API获取预测结果,常用于与自身业务平台进行集成。

使用说明

  • 部署并使用AHPA,请参见部署AHPA。

  • 基于GPU指标实现AHPA弹性预测,请参见基于GPU指标实现AHPA弹性预测。

  • 在Knative中使用AHPA弹性预测,请参见在Knative中使用AHPA弹性预测。

  • 关于如何使用AHPA解决弹性滞后问题,请参见如何使用AHPA解决弹性滞后问题。

  • 关于AHPA弹性预测的最佳实践,请参见AHPA弹性预测最佳实践。

  • 阿里云与达摩院合作的AHPA弹性预测论文,已被顶会ICDE录用,详情请参见ICDE 2022。

相关文章

为AHPA开启Prometheus大盘 2025-04-18 14:49

您可以将AHPA组件接入阿里云Prometheus监控,获得开箱即用的专属监控大盘,查看当前工作负载的CPU用量、Pod数量等监控指标。 前提条件

在Knative中使用AHPA弹性预测 2025-04-18 14:49

Knative Serverless支持AHPA(Advanced Horizontal Pod Autoscaler)的弹性能力,当应用所需资源具备周期性变化时,可通过弹性预测,预热资源,缓解您在使用Knative时遇到的冷启动问题。本文介绍如何在Knative中使用AHPA弹性预测功能。 前提条

基于GPU指标实现AHPA弹性预测 2025-04-18 14:49

AHPA可以根据从Prometheus Adapter获取到的GPU利用率数据,结合历史负载趋势和预测算法,提前预估未来的GPU资源需求,并自动调整Pod副本数量或者GPU资源分配,确保在GPU资源紧张前完成扩容操作,而在资源闲置时及时缩容,从而达到节省成本和提高集群效率的目标。 前提条件

弹性伸缩预测(AHPA) 2025-04-18 14:49

在云原生场景下,资源容量通常难以预估,而Kubernetes原生HPA存在弹性滞后和配置复杂的问题。为此,ACK推出了AHPA(Advanced Horizontal Pod Autoscaler)弹性预测,支持根据业务历史指标,自动识别弹性周期并对容量进行预测,提前进行弹性规划,解决弹性滞后的问题

通过AHPA配置自定义指标以实现应用扩缩 2025-04-18 14:49

很多场景中需要根据自定义指标(例如HTTP请求的QPS、消息队列的长度等)对应用进行扩缩容。AHPA(Autoscaling Horizontal Pod Autoscaler)提供了External Metrics机制,结合alibaba-cloud-metrics-adapter组件,可以为应用

部署AHPA 2025-04-18 14:48

容器服务 Kubernetes 版支持AHPA(Advanced Horizontal Pod Autoscaler)弹性能力。AHPA可以根据历史数据进行学习和分析,提前预测未来的资源需求,并据此动态调整Pod副本数量,确保在业务高峰到来之

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号