赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 容器服务 Kubernetes 版 ACK
  4. 产品概述
  5. 产品发布记录
  6. 历史功能发布记录(2025年之前)
  7. 历史功能发布记录(2023年)

历史功能发布记录(2023年)

  • 历史功能发布记录(2025年之前)
  • 发布于 2025-04-18
  • 0 次阅读
文档编辑
文档编辑

本文介绍容器服务ACK 2023年功能发布的相关动态。

重要

关于容器服务ACK的最新功能发布记录,请参见功能发布记录。

2023年12月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

支持基于机密虚拟机的AI模型推理保护

ACK现已支持将基于Intel® Trusted Domain Extension(Intel® TDX)技术的ECS实例加入TDX机密虚拟机计算节点池,使集群具备TDX机密计算能力,实现AI模型的可信推理和微调,保障模型数据的机密性与完整性。结合PyTorch与Intel® AMX指令集,您可以在32核实例上实现秒级出图的推理能力。 

全部

创建TDX机密虚拟机计算节点池

开服华中 1(武汉)本地地域

目前已在3个本地地域开服,分别是南京、福州和武汉。

本地地域与中心地域采用一致的飞天架构,具有小型化、一致性、低时延、低成本的特点,侧重于对本地数据处理、IT中心架构低时延平迁上云、数据实时交互等需求场景的支持。

华中 1(武汉)本地地域

开服地域

云原生AI套件

ack-ai-installer组件发布v1.8.7版本

ack-ai-installer组件结合ACK Scheduler提供共享GPU调度、GPU拓扑感知调度等能力,在v1.8.7版本中,新增支持MPS的共享GPU调度,同时所结合的阿里云GPU容器共享技术cGPU升级到v1.5.5版本。

全部

ack-ai-installer

ack-fluid组件发布v1.0.6版本

ack-fluid组件是云原生AI套件提供的分布式数据集编排和加速引擎。在v1.0.6版本中,数据操作支持设置资源请求/限制;支持多级亲和性调度策略自定义配置;JindoRuntime支持加速PV和主机目录数据访问。

全部

ack-fluid

ack-kube-queue组件发布v0.3.3版本

ack-kube-queue是云原生AI套件提供的任务队列组件,在v0.3.3版本中,通过环境变量设置全局阻塞队列时,将会全局刷新所有Queue的阻塞队列模式。

全部

ack-kube-queue

容器服务 Edge 版

DaemonSet工作负载支持AdvancedRollingUpdate和OTA升级模型

原生的滚动升级模型无法满足云边协同场景下的应用升级需求,例如由于云边网络中断,节点NotReady而导致的DaemonSet滚动升级被阻塞,或者您需要在边缘节点上直接触发应用的升级,而不由云端驱动(例如新能源汽车的OTA升级)。新增的两个升级模型将解决此类问题。

全部

DaemonSet升级模型

多地域工作负载的定制化配置

通过新增的YurtAppOverrider CRD,可以配合YurtAppSet多地域工作负载一起使用,解决不同地域内工作负载定制化配置的需求,例如同一类型应用在不同地域内需要配置不同的实例个数、镜像版本等。

全部

无

新增Raven组件替换edge-tunnel,支持 ACK Edge集群云边通信

ACK Edge集群以节点池为单位支持节点多地域分布,不同节点池的节点处于不同的网络域,无法直接通信。Raven组件提供两种模式,即代理模式和隧道模式,分别提供跨网络域的主机网络HTTP通信和容器网络通信。

全部

跨域运维通信组件Raven

分布式云容器平台 ACK One

新增注册集群快速入门

注册集群快速入门文档为您提供注册集群的快速使用流程和文档使用指引。

全部

注册集群快速入门

ACK One工作流集群支持事件驱动功能

ACK One工作流集群支持事件驱动功能,通过监控事件触发工作流自动运行,您可以使用该功能构建事件驱动的自动化系统。事件驱动支持各种事件源,包括阿里云对象存储OSS、阿里云轻量消息队列(原 MNS)、Git代码仓库、EventBridge等。

全部

开启事件驱动功能

2023年11月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

托管节点池时开启指定自动化运维功能

在创建或编辑托管节点池时,您可以选择开启节点故障自愈、kubelet自动升级、CVE自动修复等功能,以降低您的节点池运维管理压力。

全部

创建和管理节点池

分布式云容器平台 ACK One

基于ACK One多集群网关实现同城容灾

结合ACK One GitOps应用的多集群分发能力,ACK One多集群网关可以帮助您快速实现应用的同城容灾系统。

全部

基于ACK One MSE多集群网关实现同城容灾

2023年10月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

支持服务网格场景下Sidecar加速

支持服务网格场景下Sidecar加速,即在服务网格Sidecar模式下,业务注入Sidecar之后,您可以通过开启Sidecar Acceleration using eBPF组件来实现同节点下Sidecar和Sidecar之间、同Pod下业务容器和Sidecar之间的TCP网络通信加速。

全部

Sidecar Acceleration using eBPF

支持操作系统内核层的容器监控可观测能力

支持操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行容器化迁移,解决了因容器引擎层的不透明性而导致的故障排查困难问题。

全部

使用SysOM定位容器内存问题

支持单独运行集群检查

新增OpenAPI RunClusterCheck支持单独发起集群检查,支持集群升级前置检查,您可随时发起集群升级检查任务,并根据结果安排集群升级计划。

全部

发起集群检查

备份中心组件migrate-controller支持ARM64架构

备份中心组件migrate-controller新增支持ARM64架构。基于开源项目Velero开发,并与阿里云快照、云备份产品深度结合,可以为您提供数据及应用模板的备份、恢复及迁移。

全部

migrate-controller

分布式云容器平台 ACK One

支持多集群网关

ACK One通过托管MSE Ingress Controller,将MSE云原生网关作为多集群网关,并基于MSE Ingress以Ingress的方式提供多集群南北向流量的管理,从而快速实现同城应用多活容灾、流量多集群负载均衡、基于Header路由流量到指定集群等能力。

全部

多集群网关概述

2023年09月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

ack-advanced-audit组件发布v0.3.0版本

ack-advanced-audit组件是实现容器内部操作审计功能的关键组件,新版本优化了程序性能,支持近期新发布的多个Alibaba Cloud Linux操作系统内核版本。

全部

ack-advanced-audit

云原生AI套件

AI开发控制台支持将保存的Notebook镜像推送到ACR镜像仓库

ack-ai-dev-console组件是云原生AI套件提供的开发控制台组件,加入commit-agent组件与ack-commit-ctl工具后,使得ECS上Notebook实例可以保存自身状态为镜像,并支持将保存的Notebook镜像推送到ACR镜像仓库,再使用相应的镜像地址创建Notebook(如果是私有仓库,需要选择镜像拉取凭证)。

全部

在Notebook中保存自身为镜像

Arena结合ASM支持部署KServe推理服务

KServe(原KFServing)是一个开源的Kubernetes原生Serving框架,简化和加速了机器学习模型的部署和管理。它提供自动伸缩、缩容至0、蓝绿发布、金丝雀发布等特性,支持多种主流框架和编程语言,以及自定义灵活配置。

使用ACK云原生AI套件的命令行工具Arena,结合阿里云服务网格ASM,可以在ACK上快速部署基于KServe的推理服务。您只需在ASM控制台一键开启KServe on ASM(在ACK集群中安装KServe组件),然后在Arena客户端通过简单的命令提交KServe推理服务,即可将模型服务部署到ACK集群。

全部

部署Serverless模式的模型推理服务

ack-fluid组件发布v1.0.4版本

ack-fluid组件是云原生AI套件提供的分布式数据集编排和加速引擎,新版本更新如下:

  • 支持可配置FUSE Sidecar以非阻塞方式启动。

  • 支持JuiceFSRuntime配置动态更新。

  • 兼容ACK灵骏集群环境部署。

全部

ack-fluid

ack-kube-queue组件发布v0.3.1版本

ack-kube-queue是云原生AI套件提供的任务队列组件,新版本更新如下:

  • 支持在Queue中透出任务排队序列信息。

  • batchjob-extension组件新增支持通过-- qps以及-- burst设置组件的客户端QPS。

  • 修复QueueUnit被删除时偶尔导致队列错误的问题。

全部

ack-kube-queue

分布式云容器平台 ACK One

ACK One GitOps最佳实践发布

本实践基于ACK One GitOps和ACR来构建开发(Dev)、预发(Staging)、生产(Production)集群的CI/CD流水线,实现代码修改提交到Git仓库后,自动将最新镜像更新至应用,并按推荐的方式部署最新镜像到各环境中。

全部

ACK One GitOps最佳实践

支持使用Fluid 访问线下存储

Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用、AI应用等。除了Fluid原生集成的存储、缓存系统外,Fluid还提供了ThinRuntime CRD。ThinRuntime CRD允许描述任何自定义的存储系统,并将其对接到Fluid中。

全部

使用Fluid访问线下存储

支持使用Fluid加速OSS文件访问

Fluid通过管理和调度JindoRuntime实现数据集的可见性、弹性伸缩和数据迁移。JindoRuntime来源于阿里云EMR团队JindoFS,是基于C++实现的支撑Dataset数据管理和缓存的执行引擎,支持OSS对象存储。

全部

使用Fluid加速OSS文件访问

容器服务 Edge 版

支持使用NodePort service端口监听隔离

在边缘网络场景中,服务隔离是必需的。例如,当使用NodePort类型的Service时,您可以指定特定节点池的节点才允许监听 NodePort Service中的端口,从而避免可能产生的端口冲突风险。

全部

NodePort端口监听隔离

容器服务灵骏版

  • 支持国际站

  • 支持部署ack-fluid

ACK灵骏集群支持国际站,以及支持通过应用目录部署ack-fluid组件,提供分布式数据集编排和加速等能力。

全部

什么是容器服务灵骏版

2023年08月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

ACK备份中心备份计划功能优化

容器服务管理控制台支持备份任务模糊搜索、根据创建时间排序,并且可以通过克隆快速生成立即备份和备份计划。

全部

集群内备份和恢复应用

容器服务 Serverless 版

虚拟节点内置SidecarSet Controller,可替代DaemonSet相关场景

虚拟节点组件(ack-virtual-node)内置SidecarSet Controller基础功能,支持通过SidecarSet向调度到虚拟节点的Pod注入Sidecar容器。使用此机制,您可以将Container作为Sidecar容器注入到业务Pod中,实现DaemonSet相关场景的功能,例如日志收集、数据监控等。

全部

无

云原生AI套件

GPU调度支持GPU节点动态划分MIG

ACK托管集群安装云原生AI套件的调度组件ack-ai-installer后,通过给GPU节点打上特殊标签,可以让GPU节点开启MIG能力以及动态划分。节点按最大支持MIG实例数上报MIG资源,每个Pod的Container最多仅能够申请1个MIG资源。

全部

GPU节点调度属性标签

AI开发控制台支持Notebook状态保存和恢复

ack-ai-dev-console组件是云原生AI套件提供的开发控制台组件,加入commit-agent组件与ack-commit-ctl工具,使得ECS上的Notebook实例可以将自身状态保存为镜像,同时支持在指定ECS节点上恢复该Notebook。

全部

创建并使用Notebook

ack-fluid组件发布v1.0.3版本

ack-fluid组件是云原生AI套件提供的分布式数据集编排和加速引擎,v1。在0.3版本中,新增支持FUSE Sidecar特权挂载模式,修复JuiceFSRuntime控制器OOM问题,FUSE自动恢复、功能相关问题,以及升级后Runtime资源残留问题。

全部

ack-fluid

ack-kube-queue组件发布v0.2.0版本

ack-kube-queue是云原生AI套件提供的任务队列组件,v0.2.0版本中,新增支持队列级别开启队列阻塞功能,支持tfjob与pytorchjob运行超时任务重新入队,Argo Workflow整体排队,以及限制同时出队的Job数等功能。此外,还优化了队列出队失败时的日志提示。

全部

ack-kube-queue

分布式云容器平台 ACK One

注册集群支持使用CCM管理SLB负载均衡

CCM提供Kubernetes与阿里云基础产品(例如CLB等)对接的能力,因此ACK One注册集群支持部署及使用CCM来管理SLB负载均衡。

全部

注册集群使用CCM

注册集群支持自定义DNS

在混合云场景下,支持为注册集群的云上ECI指定使用自建的DNS。

全部

为注册集群指定DNS

支持开通GitOps控制台公网访问

支持开通GitOps公网访问,从而使您能更便捷地在ACK One控制台上访问GitOps进行Argo CD提交或应用的访问。

全部

开通公网访问GitOps

2023年07月

功能名称

功能描述

发布地域

相关文档

ACK托管集群标准版更名为基础版

ACK的标准版集群更名为基础版,涉及ACK托管集群、ACK Serverless集群、ACK Edge集群。OpenAPI中该字段保持不变。基础版用于个人学习和测试,正式环境请使用Pro版本。

全部

热迁移ACK托管集群基础版至ACK托管集群Pro版

ALB Ingress Controller组件发布 v2.9.0-aliyun.1版本

ALB Ingress Controller发布v2.9.0-aliyun.1版本。

全部

ALB Ingress Controller

Terway发布v1.5.5版本

Terway发布v1.5.5版本,支持为弹性网卡配置白名单。

全部

为弹性网卡(ENI)配置白名单

容器智能运维服务支持GPU节点自助诊断

ACK集群支持节点级别的GPU诊断功能。您可以通过采集GPU诊断的基础指标进行故障排查。

全部

自助诊断GPU节点问题

ACK调度器支持IP感知调度和拓扑调度等功能

  • IP感知调度

    当Pod调度到某节点上时,由于可用IP不足无法启动,该节点将被标记为缺少IP状态并被拉黑五分钟。IP感知调度可防止大量Pod由于IP不足而导致的启动失败问题。目前仅对ACK集群Pro版使用Terway网络插件的情况生效。

  • 拓扑调度

    通过特殊协议声明一批需要调度到相同拓扑域下的Pod,这批Pod将自动在不同的拓扑域下进行重试,直到找到可行的拓扑域。通过该功能可实现将Pod调度到同一部署集下,从而实现低延时或高可用。

  • 弹性配额资源信息

    CapacityScheduling支持在多层级弹性配额(ElasticQuotaTree)的状态查询中,查看当前各个弹性配额(Quota)下的资源请求量以及资源使用量等信息。

全部

无

ACK备份中心备份计划功能优化

支持以排除方式选择命名空间,支持备份计划的复制创建。

全部

备份中心

ASK正式更名为容器服务Serverless版(ACK Serverless)

容器服务Serverless版(ASK)正式更名为容器服务Serverless版(ACK Serverless),同时ACK Serverless集群也更名为 ACK Serverless集群。ACK Serverless集群基于应用实际用量按秒计费,支持秒级弹性伸缩。ACK Serverless集群下,您无需运维集群和节点。

全部

关于ASK正式更名为容器服务 Serverless 版(ACK Serverless)公告

ACK Serverless支持KServe组件,加速AI模型的部署

KServe是一个基于K8s的机器学习模型服务框架,提供简单的K8s CRD,可用于将单个或多个经过训练的模型(例如TFServing、TorchServe、Triton等推理服务器)部署到模型服务运行时。ACK Serverless支持一键部署KServe组件,提供开箱即用的模型服务,让您轻松构建自定义模型服务运行时。

全部

  • 部署KServe组件

  • 基于KServe快速部署一个推理服务

ACK Serverless支持核心组件托管,简化K8s集群运维

在ACK Serverless Pro版集群中创建的K8s核心组件会被托管,包括Kube Scheduler、Cloud Controller Manager、Kube Controller Manager、Kube API Server和CoreDNS等。组件托管后不会占用您的资源,同时降低集群的运维复杂度。

全部

什么是容器服务 Serverless 版

ACK Serverless支持Spot实例创建加速,提升大批量Spot实例创建规模

ACK Serverless提供高达100万核/小时的实例创建能力,可以在短时间内快速创建大量Spark Job等任务型并发处理实例,降低Job任务的排队时长,支撑大数据存算分离场景下的算力供给。

全部

通过ACK Serverless创建Spark计算任务

ack-kube-queue组件发布v0.1.12版本

  • 支持对单个队列设置阻塞策略

    ack-kube-queue支持阻塞队列功能,开启后队列将重复尝试调度位于队头的任务,直到队头的任务出队。在队头的任务出队前,不会尝试调度队中的其他任务。新版本中除了可以在Kube Queue Controller中设置环境变量开启阻塞队列功能,还可以对单个队列设置阻塞策略。

  • 支持配置任务出队的超时策略

    支持通过jobrunningtimeout、jobbackofftime参数控制队列的任务出队策略,当任务出队并且未成功运行的时间超过 jobrunningtimeout时,将会进入 backoff状态,backoff状态在 jobbackofftime后结束,任务将重新进入队列排队。该特性可用于缓解队头阻塞问题,当大任务由于资源碎片无法调度时,小任务由于获取不到足够Quota无法出队。目前仅Tfjob、Pytorchjob支持此功能。

全部

无

ack-fluid组件发布v1.0.2版本

ack-fluid组件是云原生AI套件提供的分布式数据集编排和加速引擎,新增以下功能:

  • 支持Fluid控制面组件安全加固。

  • 支持ECI实例将本地盘作为缓存存储介质。

  • 支持定时DataLoad缓存预热任务。

全部

无

ACK One支持通过onectl创建管理注册集群

通过onectl命令行工具,简化注册集群的创建、接入、权限设置和组件安装。

全部

  • 通过onectl创建注册集群

  • 通过onectl管理注册集群

ACK One注册集群实现IDC中K8s集群以Serverless方式使用云上CPU和GPU资源

通过注册集群实现IDC中K8s集群以 Serverless方式使用云上CPU和GPU资源。

全部

通过注册集群实现IDC中K8s集群以Serverless方式使用云上CPU和GPU资源

2023年06月

功能名称

功能描述

发布地域

相关文档

ACK Kubernetes v1.26开放升级

ACK开放Kubernetes v1.26版本升级功能,低版本集群可逐版升级至v1.26。

全部

Kubernetes 1.26

容器智能运维服务支持网络诊断

容器智能运维服务通过Skoop支持网络诊断,进一步提升平台的自运维能力。

全部

网络诊断

ACK备份中心能力增强

ACK备份中心能力增强,新增以下功能:

  • 支持备份计划编辑。

  • 支持任务与快照高级配置的展示。

全部

备份中心

ACK调度器新版本发布

ACK调度器新版本发布,新增以下功能:

  • 支持在ACK 1.26版本集群中使用GPU拓扑感知调度。

  • 自定义弹性资源优先级功能升级。

  • 支持声明各级资源中可调度Pod的最大数量。

全部

kube-scheduler

ACK Serverless集群Pro版支持开通和一键部署云原生AI套件

ASK为AI、ML、大数据工作负载提供稳定可靠、免运维、极致弹性的运行环境。在此基础上,ACK Serverless集群Pro版支持开通和一键部署云原生AI套件,提供应用高可用以及高性能部署的调度能力。Arena对主流AI计算框架任务的高效提交与管理,以及Fluid匹配Serverless场景的数据弹性和缓存预热等能力,帮您基于Serverless Kubernetes优化AI、ML、大数据工作负载的效率和性能。

全部

安装云原生AI套件

Fluid支持加速PV存储卷和主机目录数据访问,适用混合云场景

JindoRuntime是基于阿里云EMR团队JindoFS系统开发的Fluid运行时引擎,为Fluid提供Dataset数据管理和缓存功能。JindoRuntime支持在Kubernetes环境下,对PV存储卷和主机目录HostPath中的数据进行缓存,以提升后续数据访问过程的效率。该功能同样适用于混合云场景,PV存储卷可以对应任意的自建存储系统,例如CephFS等;也可以将主机目录挂载到自建存储系统,从而实现自建存储系统的数据访问加速。

全部

  • 加速PV存储卷数据访问

  • 加速主机目录数据访问

Arena支持DeepSpeed任务类型,提供DeepSpeed分布式训练实践

DeepSpeed是一个开源的深度学习优化库,提供了分布式训练和模型优化的功能,可以有效加速训练过程。云原生AI套件通过Arena支持DeepSpeed任务类型,使用Arena可以快速、方便地提交DeepSpeed的分布式训练作业,并通过TensorBoard可视化查看训练作业。

全部

DeepSpeed分布式训练

ack-kube-queue组件全面支持ARM节点

ack-kube-queue是云原生AI套件提供的任务队列组件,主要围绕Kube Queue任务队列,结合调度器和Quota系统,提供队列管理、优先级调度、使用弹性配额等功能。组件相关功能已全面支持ARM节点,可以帮您优化ACK集群ARM节点上的AI、ML工作负载和批处理工作负载的管理效率和调度性能。

全部

使用任务队列ack-kube-queue管理AI/ML工作负载

ACK One支持应用从应用中心迁移至ACK One GitOps

ACK One提供将应用从应用中心迁移到ACK One GitOps的路径。ACK One GitOps托管了开源ArgoCD,提供专属控制台域名,并与阿里云账号SSO集成,实现多集群应用交付。

全部

应用中心的应用迁移至ACK One GitOps

ACK One注册集群支持策略管理功能

注册集群基于开源OPA策略和Gatekeeper准入控制器,提供种类丰富的策略治理规则库和功能强大的控制台,保证注册集群安全运行。

全部

在注册集群中配置容器安全策略(新版)

ACK One多集群GitOps最佳实践发布

ACK One GitOps最佳实践演示如何使用开箱即用的ACK One GitOps功能,实现应用的多集群发布、升级和回滚。同时支持GitOps与CI流水线的集成、GitOps用户权限管理等。

全部

使用ACK One GitOps部署应用

2023年05月

功能名称

功能描述

发布地域

相关文档

容器服务ACK支持Kubernetes v1.26版本

ACK现已新增支持Kubernetes v1.26版本,您可在创建集群时直接创建v1.26版本的集群。

全部

Kubernetes 1.26

容器服务ACK新增支持csi-compatible-controller存储组件

compatible-controller存储组件支持Flexvolume组件和CSI组件共存于一个集群内,并通过依次切换Flexvolume集群中应用挂载的存储类型,使Flexvolume类型的存储逐渐过渡到CSI类型。

全部

  • csi-compatible-controller

  • 通过csi-compatible-controller组件迁移Flexvolume至CSI

ACK Serverless集群支持以指定ECS规格创建U实例规格

ASK支持以指定ECS规格创建U实例规格,统一支持多款处理器,相比上一代主售实例降价高达40%。同时,新增按年支付节省计划(Saving Plan)弹性版,面向非固定波峰波谷场景,成本额外再降低10%。

全部

通过指定ECS规格创建ECI Pod

ACK Serverless集群支持成本洞察功能

ASK支持成本套件,支持从集群、命名空间、应用多维度洞察弹性资源成本,精细化成本趋势预测及根因分析,协助IT资产管理员优化资源规格和付费策略,让成本治理更加便捷。

全部

成本洞察

Fluid支持EFC Runtime加速NAS或CPFS文件访问

EFC弹性文件客户端(Elastic File Client)是阿里云文件存储团队开发的基于FUSE的用户态POSIX客户端,基于阿里云文件存储服务的高扩展性、原生POSIX接口和高性能目录树结构,打造云原生存储系统。Fluid通过EFCRuntime的Kubernetes自定义资源对接EFC,帮您实现数据集的可见性、弹性伸缩等能力。

全部

EFC加速NAS或CPFS文件访问

ack-kube-queue支持阻塞队列和严格优先级调度

任务队列ack-kube-queue允许系统管理员使用自定义队列的作业队列管理,以提高队列的灵活性。

  • 支持阻塞队列功能。开启后,队列将重复尝试调度位于队头的任务,直到队头的任务出队。在队头的任务出队前,不会尝试调度队列中的其他任务。

  • 支持严格优先级调度功能。开启后,队列在调度时将总是从更高优先级以及更早提交的任务开始尝试调度,任务将不会由于退避而错失调度机会。

全部

使用任务队列ack-kube-queue管理AI/ML工作负载

云原生AI套件支持VSCode类型的Notebook

云原生AI套件支持创建VSCode类型的Notebook,用于机器学习算法的开发调试,并将算法提交到ACK集群中进行训练。云原生AI套件可按用户选择,将开源JupyterLab、用户自定义Jupyter或者VSCode服务镜像,部署到ACK集群中作为AI模型集成开发环境,并将云原生AI套件中的自动配置与ACK集群中的用户权限机制集成。

全部

创建并使用Notebook

ACK One支持GitOps控制台的开启和跳转

ACK One支持GitOps功能,您可以在ACK One主控实例管理页面,开启和关闭GitOps控制台,并提供跳转链接,便于访问GitOps控制台。

全部

登录GitOps系统

ACK One提供GitOps控制面日志与审计日志

ACK One支持GitOps控制面日志与审计日志查看功能,您可以在ACK One主控实例管理页面,查看GitOps控制面组件的日志及其审计日志。

全部

开启GitOps控制面日志与审计日志

2023年04月

功能名称

功能描述

发布地域

相关文档

集群删除支持同步删除日志Project

集群删除支持以勾选的方式同步删除日志Project。

重要

由于日志Project包含多个Logstore,勾选删除后会导致日志数据丢失,建议谨慎操作。

全部

删除集群

ACK调度器4.1版本发布

  • 弹性调度可通过ElasticResource将Pod调度到ARM节点。

  • 为防止资源泄露,在Capacity Scheduling场景中,若应用的ElasticQuota使用已超限,则默认禁止Autoscaler为其弹出更多节点;在Gang Scheduling场景中,若应用的Pod数量已无法满足Gang要求,则默认禁止Autoscaler为其弹出更多节点。

全部

kube-scheduler

Fluid支持控制面组件监控

Fluid是开源Kubernetes原生的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用、AI应用等。容器服务ACK通过阿里云Prometheus监控一键接入Fluid组件,对Fluid控制面组件进行监控,并提供开箱即用的监控大盘。

全部

开启Fluid组件监控

ACK One GitOps支持配置多租户权限

您可通过配置ACK One GitOps多租户权限对不同角色的访问资源进行权限控制,避免因权限控制缺失引发的安全风险。

全部

配置ACK One GitOps多租户权限

ACK灵骏集群发布

阿里云容器服务ACK灵骏集群是容器服务 Kubernetes 版针对阿里云智能计算灵骏产品,提供全托管和高可用控制面的基础Kubernetes集群服务。以灵骏计算节点作为Kubernetes集群的工作节点,并通过内置云原生AI套件能力,支持大规模、高性能的AI任务生产和交付。

全部

什么是容器服务灵骏版

2023年03月

功能名称

功能描述

发布地域

相关文档

Terway组件参数支持交换机配置

新增支持通过控制台增加或者减少交换机实例的配置。您可在组件管理的Terway-eniip组件配置勾选增加或者减少交换机,以更改Pod创建时从交换机分配IP的网段。

全部

修改Pod虚拟交换机

ACK支持通过CNFS存储卷的监控仪表大盘定位NAS或CPFS客户端IO问题

您可以通过CNFS存储卷的监控仪表大盘定位分析客户端的IO操作问题,并定位到问题所在的相关业务(Pod)。例如,哪些频繁的操作会导致系统繁忙,占用大量带宽等常见的客户端IO问题。

全部

通过CNFS可观测性定位NAS或CPFS客户端IO问题

ACK One支持RAM用户权限管理

ACK One管理员可以通过为RAM用户授权,允许RAM用户访问并操作多集群主控实例。

全部

为RAM用户授权

ACK One GitOps Image Updater支持应用镜像自动更新

Image Updater监控ACR中镜像的更新,自动更新GitOps应用的镜像版本,实现与三方CI镜像构建系统的集成,形成从CI构建到GitOps发布的完整全自动交付流水线

全部

基于ACK One和ACR构建应用GitOps全自动化交付流水线

云原生AI套件的计量模式和定价方案升级

为了提供更好的体验,云原生AI套件对计量模式和定价方案进行了升级,提供更为精细、准确的计量模式和分阶梯的定价方案。2023年04月01日00:00:00起,云原生AI套件限时5折优惠活动结束,新版定价正式生效。

全部

  • 【产品变更】云原生AI套件计量模式和定价方案升级公告

  • 云原生AI套件计费说明

ack-fluid发布v0.9.7版本

ack-fluid是云原生AI套件的数据缓存加速组件,发布新版本v0.9.7,修复部分已知问题,进行安全加固。

全部

【组件升级】云原生AI套件ack-fluid组件升级公告

Gang scheduling调度策略支持GangGroup等高级功能

ACK Pro托管版集群支持Gang scheduling能力,解决了原生调度器无法支持All-or-Nothing作业调度的问题。当使用Gang scheduling时,任务可能有多个角色。单一的PodGroup无法满足不同角色对资源min-available的需求,使用多个PodGroup会失去Gang的保证。通过GangGroup功能可以解决这个问题,保证任务多个角色的min-available条件均得到满足。此外,还支持了通过matchpolicy控制Gang的重试策略等高级功能。

全部

使用Gang scheduling

2023年02月

功能名称

功能描述

发布地域

相关文档

节点池支持Kubelet参数自定义功能

Kubelet提供一系列配置用于调整节点行为。ACK支持修改节点池内节点的Kubelet配置。修改完成后,节点池的所有节点会轮转生效,同时节点池新增的节点也会使用新的Kubelet配置。

全部

自定义节点池kubelet配置

AIOps支持Service诊断功能

ACK AIOps支持Service诊断功能,包含CLB计费类型、CLB证书、CLB是否支持复用、CLB配额、异常Event等问题的诊断。

全部

Service诊断

ACK支持变更云盘类型

ACK支持您根据业务需求变更云盘的类型。例如,创建云盘时选择了SSD云盘,但后期需要更高的IOPS时,您可以将该云盘变配为ESSD云盘。

全部

变更云盘类型

ACK支持使用cloud_auto类型云盘作为动态存储卷

ACK支持在原有cloud_efficiency、cloud_ssd、cloud_essd、available四种云盘类型基础上新增cloud_auto类型云盘作为动态存储卷。

全部

使用云盘动态存储卷

ACK One GitOps支持使用阿里云账号登录开源ArgoCD UI或ArgoCD CLI

ACK One GitOps默认打通ArgoCD UI和ArgoCD CLI向阿里云RAM的SSO认证。当您登录阿里云控制台后,可以通过SSO登录ArgoCD UI或ArgoCD CLI,无需再次输入用户名和密码。

全部

登录GitOps系统

更多信息

有关ACK的历史功能发布记录,请参见历史功能发布记录(2025年之前)。

相关文章

历史功能发布记录(2024年) 2025-04-18 11:43

本文介绍容器服务ACK 2024年功能发布的相关动态。 重要 关于容器服务ACK的最新功能发布记录,请参见功能发布记录。

历史功能发布记录(2023年) 2025-04-18 11:43

本文介绍容器服务ACK 2023年功能发布的相关动态。 重要 关于容器服务ACK的最新功能发布记

历史功能发布记录(2022年) 2025-04-18 11:43

本文介绍容器服务ACK 2022年功能发布的相关动态。 背景信息

历史功能发布记录(2021年) 2025-04-18 11:43

本文介绍容器服务ACK 2021年功能发布的相关动态。 背景信息

历史功能发布记录(2020年及之前) 2025-04-18 11:43

本文介绍容器服务ACK 2020年及之前的功能发布的相关动态。 背景信息

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号