ACK Edge集群的边缘节点池支持管理线下GPU资源。本文介绍如何在ACK Edge集群中的边缘节点池中添加GPU节点。
前提条件
已创建ACK Edge集群。
在接入节点前,需要先安装好GPU驱动,驱动版本相关信息请参见ACK支持的NVIDIA驱动版本列表。
使用限制
请确保您的集群配额充足。如需添加更多节点,请到配额平台提交申请扩大配额。关于ACK Edge集群的配额限制,请参见配额与限制。
添加GPU节点时会访问部分域名地址,需要节点侧网络安全组放开限制允许访问。具体信息,请参见节点接入访问域名和IP路由网段配置。
操作步骤
1.26及以上版本集群
ACK Edge集群从1.26版本开始,接入Nvidia GPU时,无需配置gpuVersion
参数直接接入,由接入工具自动检查GPU型号并安装相关组件。
添加GPU节点的操作与其他边缘节点操作一致,具体操作,请参见添加边缘节点。
1.26及以上版本的ACK Edge集群支持全系列NVIDIA官方发布的生产级(Production Grade)GPU显卡,包括Tesla系列、Hopper(H系列)、Ada Lovelace(A系列)以及L系列。
1.26以下版本集群
在1.26以下版本ACK Edge集群中添加GPU节点时,需要选择以下支持的GPU型号。如果有其他GPU型号需求,请提交工单处理。
系统架构 | GPU型号 | 边缘Kubernetes集群版本 |
AMD64/x86_64 | Nvidia_Tesla_T4 | ≥1.16.9-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_P4 | ≥1.16.9-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_P100 | ≥1.16.9-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_V100 | ≥1.18.8-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_A10 | ≥1.20.11-aliyunedge.1 |
AMD64/x86_64 | Nvidia_L40 | ≥1.26.3-aliyun.1 |
登录容器服务管理控制台,在左侧导航栏选择集群列表。
在集群列表页面,单击目标集群名称,然后在左侧导航栏,选择 。
在节点池页面,选择目标节点池右侧操作列的 。
进入添加节点页面,单击手动添加,添加现有实例。
单击下一步进入实例信息页面,您可以在此处填写节点接入配置,具体的配置参数,请参见参数列表。
说明生成节点接入脚本时,需配置
gpuVersion
参数。当前支持的GPU版本如下请参见使用限制。该参数配置完成后,接入工具会自动安装nvidia-containerd-runtime,关于nvidia-containerd-runtime更多信息,请参见nvidia-containerd-runtime。
配置完成后单击下一步,进入添加完成页面,单击复制,到您的边缘节点上粘贴并执行该脚本。
添加节点成功的结果如下图所示。
相关文档
如果您在添加边缘节点时遇到问题,请参见诊断边缘节点问题。
如果您需要移除不使用的边缘节点,请参见移除边缘节点。
如果您需要实现边缘节点的自主管理,当云边网络断开时,边缘节点上的业务仍然可以持续稳定地运行。具体操作,请参见设置边缘节点自治。