• 什么是AI通信加速库DeepNCCL 2025-04-14 19:17

    DeepNCCL是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍DeepNCCL的架构、优化原理和性能说明。 产品简介 DeepNCCL基于NCCL(NVIDIA Collective Communications Li

  • 什么是推理引擎DeepGPU-LLM 2025-04-14 19:17

    DeepGPU-LLM是阿里云研发的基于GPU云服务器的大语言模型(Large Language Model,LLM)的推理引擎,在处理大语言模型任务中,该推理引擎可以为您提供高性能的大模型推理服务。 产品简介 DeepGPU-LLM作为阿里云开发的一套推理引擎,具有易用性和广泛适用性,旨在优化大语

  • 什么是GPU容器共享技术cGPU 2025-04-14 19:17

    GPU容器共享技术cGPU是阿里云基于内核虚拟GPU隔离的容器共享技术。即多个容器共享一张GPU卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。 为什么选择cGPU

  • 什么是Deepytorch 2025-04-14 19:17

    Deepytorch是阿里云自研的AI加速器,为生成式AI和大模型场景提供训练和推理加速功能。在训练方面,Deepytorch在保障精度的前提下实现端到端训练性能的显著提升,可降低训练成本,提升迭代速度。在推理方面,Deepytorch通过即时编译技术对模型进行推理优化,可实现高效、快速的推理加速效

  • 什么是Deepytorch Training(训练加速) 2025-04-14 19:17

    Deepytorch Training是阿里云自研的AI训练加速器,为传统AI和生成式AI场景提供训练加速功能。本文主要介绍Deepytorch Training在训练加速上的概念、优势及特性等。 Deepytorch Training介绍 Deepytorch Training面向传统AI和生成式

  • 什么是Deepytorch Inference(推理加速) 2025-04-14 19:17

    Deepytorch Inference是阿里云自研的AI推理加速器,专注于为Torch模型提供高性能的推理加速。通过对模型的计算图进行切割、执行层融合以及高性能OP的实现,大幅度提升PyTorch的推理性能。本文介绍Deepytorch Inference在推理加速方面的概念、优势及模型支持情况。