• 弹性伸缩概述 2025-04-15 17:15

    弹性伸缩是根据业务需求和策略,自动调整计算资源的管理服务,典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理等。本文介绍ACK Serverless集群支持的弹性伸缩方案。

  • 使用容器水平伸缩(HPA) 2025-04-15 17:15

    如果您想基于CPU使用率、内存使用率或其他自定义指标实现Pod的自动扩缩,建议您为业务容器开启水平伸缩HPA(Horizontal Pod Autoscaler)功能。HPA能够在业务负载急剧飙升时快速扩容多个Pod副本来缓解压力,也可以在业务负载变小时根据实际情况适当缩容以节省资源,无需您人为干预

  • 使用容器定时水平伸缩(CronHPA) 2025-04-15 17:15

    如果您的应用资源使用率存在周期性变化,需要按照类似Crontab的策略定时对Pod进行扩缩容,您可以使用容器定时水平伸缩CronHPA(CronHorizontal Pod Autoscaler)实现Pod的定时扩缩容。CronHPA适用于业务流量有明显高峰时段、应用程序需要在特定时间执行任务等场景

  • 容器垂直伸缩(VPA) 2025-04-15 17:15

    通过在ACK Serverless集群上部署安装VPA(vertical-pod-autoscaler),ACK Serverless可以提供垂直的容器伸缩的功能。VPA会基于Pod的资源使用情况自动为集群设置资源占用的限制,从而让集群将Pod调度到有足够资源的最佳节点上。VPA也会保持最初容器定义

  • 基于阿里云组件指标的容器水平伸缩 2025-04-15 17:15

    应对业务突发流量时,更精准的扩缩容能够提高响应速度,并进一步提升集群资源利用效率。本文介绍如何利用Kubernetes的外部指标接口(External Metrics)集成重要业务指标(例如HTTP请求率、Ingress QPS等),实现更自动化的伸缩策略。 本文将通过以下步骤,以创建名为Nginx

  • 基于阿里云Prometheus指标的容器水平伸缩 2025-04-15 17:15

    HPA默认支持基于CPU和内存指标实现自动伸缩,可能无法满足更为复杂的运维场景。如果您需要将Prometheus收集的Custom Metrics与External Metrics转换为HPA可用的弹性伸缩指标,您可以参见本文获取监控数据并实现对应的伸缩配置,为应用提供更灵活、便捷的扩缩机制。 前提

  • 通过Nginx Ingress对多个应用进行HPA 2025-04-15 17:15

    多实例部署可以最大程度的保证应用的稳定性,但同时也会造成闲时资源的浪费和高额成本。手动调节方式工作量大还存在一定程度的滞后性。通过Nginx Ingress对多个应用进行HPA,可以自动根据应用的负载情况动态调整Pod副本数量,从而在保障应用稳定性和响应能力的同时,优化资源使用,降低成本。本文介绍通

  • 弹性伸缩预测(AHPA) 2025-04-15 17:15

    在云原生场景下,资源容量通常难以预估,而Kubernetes原生HPA存在弹性滞后和配置复杂的问题。为此,ACK推出了AHPA(Advanced Horizontal Pod Autoscaler)弹性预测,支持根据业务历史指标,自动识别弹性周期并对容量进行预测,提前进行弹性规划,解决弹性滞后的问题