赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. ACK Edge集群
  4. 操作指南
  5. 节点管理
  6. 边缘节点管理
  7. 添加GPU节点

添加GPU节点

  • 边缘节点管理
  • 发布于 2025-04-21
  • 0 次阅读
文档编辑
文档编辑

ACK Edge集群的边缘节点池支持管理线下GPU资源。本文介绍如何在ACK Edge集群中的边缘节点池中添加GPU节点。

前提条件

  • 已创建ACK Edge集群。

  • 在接入节点前,需要先安装好GPU驱动,驱动版本相关信息请参见ACK支持的NVIDIA驱动版本列表。

使用限制

  • 请确保您的集群配额充足。如需添加更多节点,请到配额平台提交申请扩大配额。关于ACK Edge集群的配额限制,请参见配额与限制。

  • 添加GPU节点时会访问部分域名地址,需要节点侧网络安全组放开限制允许访问。具体信息,请参见节点接入访问域名和IP路由网段配置。

操作步骤

1.26及以上版本集群

ACK Edge集群从1.26版本开始,接入Nvidia GPU时,无需配置gpuVersion参数直接接入,由接入工具自动检查GPU型号并安装相关组件。

添加GPU节点的操作与其他边缘节点操作一致,具体操作,请参见添加边缘节点。

说明

1.26及以上版本的ACK Edge集群支持全系列NVIDIA官方发布的生产级(Production Grade)GPU显卡,包括Tesla系列、Hopper(H系列)、Ada Lovelace(A系列)以及L系列。

1.26以下版本集群

在1.26以下版本ACK Edge集群中添加GPU节点时,需要选择以下支持的GPU型号。如果有其他GPU型号需求,请提交工单处理。

系统架构

GPU型号

边缘Kubernetes集群版本

AMD64/x86_64

Nvidia_Tesla_T4

≥1.16.9-aliyunedge.1

AMD64/x86_64

Nvidia_Tesla_P4

≥1.16.9-aliyunedge.1

AMD64/x86_64

Nvidia_Tesla_P100

≥1.16.9-aliyunedge.1

AMD64/x86_64

Nvidia_Tesla_V100

≥1.18.8-aliyunedge.1

AMD64/x86_64

Nvidia_Tesla_A10

≥1.20.11-aliyunedge.1

AMD64/x86_64

Nvidia_L40

≥1.26.3-aliyun.1

  1. 登录容器服务管理控制台,在左侧导航栏选择集群列表。

  2. 在集群列表页面,单击目标集群名称,然后在左侧导航栏,选择节点管理 > 节点池。

  3. 在节点池页面,选择目标节点池右侧操作列的图标添加已有节点。

  4. 进入添加节点页面,单击手动添加,添加现有实例。

  5. 单击下一步进入实例信息页面,您可以在此处填写节点接入配置,具体的配置参数,请参见参数列表。

    image

    说明
    • 生成节点接入脚本时,需配置gpuVersion参数。当前支持的GPU版本如下请参见使用限制。

    • 该参数配置完成后,接入工具会自动安装nvidia-containerd-runtime,关于nvidia-containerd-runtime更多信息,请参见nvidia-containerd-runtime。

  6. 配置完成后单击下一步,进入添加完成页面,单击复制,到您的边缘节点上粘贴并执行该脚本。

    添加节点成功的结果如下图所示。

    接入成功

相关文档

  • 如果您在添加边缘节点时遇到问题,请参见诊断边缘节点问题。

  • 如果您需要移除不使用的边缘节点,请参见移除边缘节点。

  • 如果您需要实现边缘节点的自主管理,当云边网络断开时,边缘节点上的业务仍然可以持续稳定地运行。具体操作,请参见设置边缘节点自治。

相关文章

添加边缘节点 2025-04-21 11:16

ACK Edge集群的边缘节点池支持添加多种类型的资源,例如不同地域的ECS节点,IDC节点,其他厂商云节点,以及分布在工厂、门店、车辆和船舶中的服务器节点。本文介绍如何在ACK Edge集群中的边缘节点池中添加边缘节点。

添加GPU节点 2025-04-21 11:16

ACK Edge集群的边缘节点池支持管理线下GPU资源。本文介绍如何在ACK Edge集群中的边缘节点池中添加GPU节点。 前提条件 已创建AC

移除边缘节点 2025-04-21 11:16

您需要从容器服务管理控制台的节点池页面进行标准化操作,移除ACK Edge集群不需要的节点,以免带来不符合预期的效果。本文介绍如何移除边缘节点。

升级边缘节点 2025-04-21 11:16

为避免过期版本集群潜在的安全和稳定性风险,同时体验新版本集群的功能,建议您按照ACK Edge集群的版本发布流程及时升级集群。边缘节点升级是集群升级的一部分,您需要登录到边缘节点手动执行此步骤。本文介绍如何升级边缘节点。 前提条件 升级边缘节点池之前须保证控制面已升级完成。升级集

设置边缘节点自治 2025-04-21 11:16

ACK Edge集群支持边缘节点自治,在边缘和云端网络断连状态下,保证边缘节点上的业务应用仍然可以持续稳定地运行,而不会被驱逐或者迁移到其他边缘节点。如果您将边缘节点设置为非自治,云边断连时节点上的应用在到达容忍时间之后将会被驱逐。本文介绍如何为边缘节点设置节点的自治属性。

边缘节点离线运维 2025-04-21 11:16

在云边场景下,边缘节点可能会因为网络不稳定而处于离线状态。离线的边缘节点如果设置了节点自治,节点上的业务可以不受影响持续运行,但您无法再通过云端控制面对边缘节点上的业务做运维变更。ACK Edge集群提供了边缘节点离线运维工具,用于支持用户在紧急情况下,对离线节点上的业务进行运维操作,例如业务回滚,

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号