赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. ACK Edge集群
  4. 操作指南
  5. 节点管理
  6. 云端节点管理
  7. 节点

节点

  • 云端节点管理
  • 发布于 2025-04-21
  • 0 次阅读
文档编辑
文档编辑

本文汇总容器服务管理控制台支持的管理Worker节点的常见操作。您可以参见本文了解操作方式及相关注意事项。

大部分操作可在节点页面执行。

  1. 登录容器服务管理控制台,在左侧导航栏选择集群列表。

  2. 在集群列表页面,单击目标集群名称,然后在左侧导航栏,选择节点管理 > 节点。

节点登录

在节点故障排除、节点性能监控、执行自定义脚本等场景下,您可以登录节点对应的ECS实例。

  • Workbench连接:在节点列表的操作列,选择更多 > Workbench 远程连接。

  • VNC连接:在节点列表的操作列,选择更多 > VNC 远程连接。

更多ECS实例远程连接的方式,请参见ECS远程连接方式概述。

说明

如果您的操作系统为ContainerOS,为了减少潜在的安全风险,ContainerOS原则上不支持任何用户直接登录到系统进行一系列可能无法追溯的操作,也不提供SSH登录功能。若您仍然有登录实例进行运维操作的需求,请参见ContainerOS运维容器使用指导。

节点排水和调度状态

节点排水

在节点列表的操作列,选择更多 > 节点排水,按照页面提示完成节点排水,即排空节点上的已有Pod,然后将节点标识为不可调度状态, 后续新建Pod不会再调度到该节点。

请关注以下注意事项。

  • 确保集群其他节点的资源充足,以避免业务Pod无法调度。

  • 检查待移除节点上的Pod的节点亲和性规则和调度策略,确保Pod不会因为节点移除而无法调度到其他节点。

  • 由DaemonSet控制的Pod不会被排空。

更改节点调度状态

在节点列表,勾选目标节点, 然后单击页面下面的设置调度状态,仔细阅读对话框的注意事项后,按照页面提示完成操作。

请关注以下注意事项。

  • 此操作可能会对业务产生影响,建议在业务低峰期进行。

  • 将节点设置为不可调度后,节点会被标识为SchedulingDisabled。节点上已有的Pod继续对外提供服务,但后续新建的Pod不会再调度到该节点。

  • 由DaemonSet控制的Pod不会被排空。

节点移除

当您不再需要某Worker节点继续工作时,可以在业务低峰期通过容器服务管理控制台将节点从节点池或集群中移除。在节点列表的操作列,选择更多 > 移除或勾选节点后在页面下方单击批量移除,并按照页面提示完成操作。

相关注意事项和功能介绍,请参见移除节点。

节点监控

在节点列表的操作列,单击监控,按照页面提示安装组件并启用阿里云Prometheus,查看节点资源监控大盘。关于基于阿里云Prometheus监控配置监控告警的更多信息,请参见配置Prometheus监控告警。

关于如何实现在节点状态异常时自定义PromQL来创建告警规则,请参见节点状态异常。

节点故障诊断

在节点列表的操作列,单击异常节点对应的故障诊断,进行节点检查并获取对应的修复方案。关于支持诊断的异常场景、诊断的检查项及其修复方案,请参见节点诊断。

管理节点标签和污点

如需通过标签(Labels) 和污点(Taints) 管理和调度集群中的资源,可在节点页面,单击标签与污点管理,然后按照页面指引完成标签名称和值的配置,请参见管理节点标签和污点。

节点批量运维

如需批量运维ACK集群中的Worker节点,例如安全更新操作系统内核,安装自定义的监控、安全、审计软件包等,可在节点列表勾选需要批量运维的节点,在页面下方单击批量运维,然后按照控制台指引完成操作。详细信息,请参见批量运维节点。

查看节点信息

在节点列表的操作列,选择更多 > 查看YAML,查看节点YAML信息。

在节点列表的操作列,选择更多 > 详情,查看节点信息。

  • CPU和内存使用量

    • CPU请求量 = SUM(当前节点上所有Pod的CPU请求值)/ 节点可分配的CPU

    • CPU使用量 = SUM(当前节点上所有Pod的CPU实际使用量)/ 节点可分配的CPU

    • 内存请求量= SUM(当前节点上所有Pod的内存请求值)/ 节点可分配的内存

    • 内存使用量 = SUM(当前节点上所有Pod的内存实际使用量)/ 节点可分配的内存

    说明

    节点可分配资源(Allocatable) = 总资源(Capacity)-预留资源(Reserved)-驱逐阈值(Eviction-Threshold)。更多信息,请参见节点资源预留策略。

  • 节点基本信息

    节点名称、IP地址、实例ID、容器运行时版本、操作系统及内核等。

  • 其他

    节点CPU和内存资源的分配情况(Request和Limit)、节点状态、Pod列表、节点Event等。

相关文档

  • 您可以使用ACK提供的资源画像功能,基于资源使用量的历史数据获得容器粒度的资源规格推荐,简化为容器配置Request和Limit的复杂度。更多信息,请参见资源画像。

    关于如何配置业务Pod所需资源的具体操作,请参见创建无状态工作负载Deployment。

  • 通过设置节点标签和nodeSelector策略,您可以将应用调度到指定节点上。详细信息,请参见调度应用至指定节点。

  • 关于如何升降配Worker节点资源,请参见升降配节点资源。

  • 关于如何为节点添加数据盘,存储容器运行时、kubelet等资源,请参见为节点添加数据盘。

  • 关于如何实现数据盘、系统盘的扩容,请参见扩容节点系统盘或数据盘。

  • 节点的升级(kubelet版本和运行时版本)在节点池维度进行,请参见升级节点池。

相关文章

节点 2025-04-21 11:17

本文汇总容器服务管理控制台支持的管理Worker节点的常见操作。您可以参见本文了解操作方式及相关注意事项。 大部分操作可在节点页面执行。

移除节点 2025-04-21 11:17

当您不再需要该节点继续工作时,请您在容器服务管理控制台的节点池页面进行移除节点的标准化操作,以免带来不符合预期的效果。移除节点会涉及Pod迁移,可能会影响业务,请在业务低峰期操作。 前提条件

管理节点标签 2025-04-21 11:17

您可以通过容器服务控制台对节点进行标签管理,包括批量添加节点标签、通过标签筛选节点和快速删除节点标签。 前提条件 已创建ACK托管集群。

管理节点污点 2025-04-21 11:17

污点可以使Pod排斥一类特定的节点,每个节点上都可以应用一个或多个污点。本文介绍如何批量添加污点和删除污点。 前提条件 已创建ACK集群。详细信息,请参见创建ACK托管集群。

设置节点调度状态 2025-04-21 11:17

您可以通过容器服务控制台设置节点调度状态,从而合理分配各节点的负载。 操作步骤

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号