赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 函数计算 FC 3.0
  4. 操作指南
  5. 创建函数
  6. 创建GPU函数

创建GPU函数

  • 创建函数
  • 发布于 2025-04-16
  • 0 次阅读
文档编辑
文档编辑

如果您需要使用流行AI项目,如Stable Diffusion WebUI、ComfyUI、RAG、TensorRT等底层需要使用GPU实例来加速计算的应用,推荐以镜像方式部署函数应用。将容器镜像作为函数的交付物,提升开发和交付效率。

创建函数

  1. 登录函数计算控制台,在左侧导航栏,单击函数。

  2. 在顶部菜单栏,选择地域,然后在函数页面,单击创建函数。

  3. 在创建函数页面,选择GPU 函数,设置以下配置项,然后单击创建。

    • 基本设置:设置函数名称。

    • 函数代码:配置函数的运行环境和代码相关信息。

      配置项

      说明

      示例

      运行环境

      • 使用示例镜像:选择函数计算提供的示例镜像,快速体验部署镜像函数。您需要从配置项容器镜像下方镜像列表中选择目标镜像。

      • 使用ACR中的镜像:单击配置项容器镜像下方的选择 ACR 中的镜像,在弹出的选择容器镜像面板,选择已创建的容器镜像实例和ACR 镜像仓库,然后在下方选择镜像区域找到目标镜像并在其右侧操作列单击选择。

      使用示例镜像

      容器镜像

      选择目标镜像。

      SpringBoot Web 应用示例镜像

      启动命令

      程序的启动命令。如果不配置启动命令,则默认使用镜像中的Entrypoint/CMD。

      无

      监听端口

      您的代码中的HTTP Server所监听的端口。

      9000

    • 高级配置:配置函数的实例相关信息和函数执行超时时间等。

      配置项

      说明

      示例

      GPU 卡型

      选择GPU卡型,关于GPU卡型介绍,请参见规格介绍。

      Tesla系列

      规格方案

      根据您的业务情况,选择或手动输入合理的GPU 显存规格、vCPU规格和内存规格组合。关于各资源使用的计费详情,请参见计费概述。

      GPU实例规格与实例并发度的关系

      • Tesla系列整卡显存为16GB,以设置1 GB显存为例,则单卡同时承载16个GPU容器,由于各地域的GPU卡数配额默认最大为30,地域级别最多可同时承载480个GPU容器。

        • 当GPU函数实例并发度为1时,该函数在地域级别的推理并发度为480。

        • 当GPU函数实例并发度为5时,该函数在地域级别的推理并发度为2400。

      • Ada系列整卡显存为48GB,仅支持整卡显存,则单卡同时承载1个GPU容器,由于各地域的GPU卡数配额默认最大为30,地域级别最多可同时承载30个GPU容器。

        • 当GPU函数实例并发度为1时,该函数在地域级别的推理并发度为30。

        • 当GPU函数实例并发度为5时,该函数在地域级别的推理并发度为150。

      GPU显存规格=4 GB

      vCPU规格=2 vCPU

      内存规格=4 GB

      临时硬盘大小

      根据您的业务情况,选择临时存储文件的硬盘大小。函数计算为您提供512 MB以内的硬盘免费使用额度,超过512 MB后开始计费。

      说明

      临时硬盘中所有目录可写,共享临时硬盘的空间。

      临时硬盘大小与底层执行函数的实例生命周期一致,实例被系统回收后,硬盘上的数据也会消失。如您需要对文件进行持久化保存,可以选择挂载NAS或OSS。具体操作,请参见配置NAS文件系统和配置OSS对象存储。

      512 MB

      执行超时时间

      设置超时时间。执行超时时间默认为60秒,最长为86400秒。

      60

      单实例并发度

      函数计算支持一个实例同时并发执行多个请求,这个值用来配置单个函数实例可以同时处理多少个请求。具体操作,请参见配置单实例并发度。

      20

      时区

      选择函数的时区。在此处设置函数的时区后,将自动为函数添加一条环境变量TZ,其值为您设置的目标时区。

      UTC

      函数角色

      函数计算平台会使用这个RAM角色来生成访问您的阿里云资源的临时密钥,并传递给您的代码。更多信息,请参见授予函数计算访问其他云服务的权限。

      mytestrole

      允许访问 VPC

      是否允许函数访问VPC内资源。更多信息,请参见配置网络。

      是

      专有网络

      允许访问 VPC选择是时必填。创建新的VPC或在下拉列表中选择要访问的VPC ID。

      fc.auto.create.vpc.1632317****

      交换机

      允许访问 VPC选择是时必填。创建新的交换机或在下拉列表中选择交换机ID。

      fc.auto.create.vswitch.vpc-bp1p8248****

      安全组

      允许访问 VPC选择是时必填。创建新的安全组或在下拉列表中选择安全组。

      fc.auto.create.SecurityGroup.vsw-bp15ftbbbbd****

      允许函数默认网卡访问公网

      是否允许函数通过默认网卡访问公网。关闭后,当前服务中的函数将无法通过函数计算的默认网卡访问公网。

      重要

      使用固定公网IP地址功能时,您必须关闭允许函数默认网卡访问公网,否则配置的固定公网IP地址不生效。更多信息,请参见配置固定公网IP地址。

      是

      日志功能

      是否启用阿里云日志服务。取值说明如下:

      • 启用:函数的执行日志被持久化保存到日志服务,方便您进行代码调试、故障分析和数据分析等。

      • 禁用:函数的执行日志将无法通过日志服务存储和查询。

      启用

    • 环境变量:设置函数运行环境中的环境变量。更多信息,请参见配置环境变量。

编辑函数

函数创建完成后,如果需要变更镜像,您可以在函数详情页的配置页签,编辑运行时,详见下图。

image

更多修改,例如修改环境变量、日志存储等设置,请参见配置函数。

删除函数

登录函数计算控制台,单击函数,选择地域,在目标函数的操作列,选择更多 > 删除,然后在弹出的对话框,确认要删除的函数已无任何触发器、预留实例等绑定资源后,再次确认删除。

image

相关文档

  • 针对不同使用场景,函数计算提供事件函数、Web函数、任务函数和GPU函数四种函数类型,关于如何针对使用场景选择函数类型,请参见函数选型。

  • 除控制台外,函数计算还提供API的方式来管理函数,具体请查看函数。

  • 函数执行超时,您可以尝试的操作见函数执行超时,报错Function time out after怎么办?。

  • 使用频率较低的函数调用时间会比较长,具体原因见为什么使用频率较低的函数调用时间比较长?。如果想消除冷启动延时的影响,可以使用预留模式的实例,具体可参考如何让实例一直存活不销毁,消除冷启动延时的影响?。

  • 如果您想获取函数的ARN在代码中定位阿里云资源,可参见获取函数ARN。

相关文章

创建事件函数 2025-04-16 14:38

如果您想通过特定的事件触发函数,如OSS触发器、RocketMQ触发器等消息类触发器,您可以选择创建事件函数。您需要按照函数计算定义的接口编写函数和程序。

创建Web函数 2025-04-16 14:38

如果您想基于各个语言的流行框架如Flask、Express或SpringBoot等编写程序,或者迁移已有的框架应用至函数计算,您可以选择创建Web函数。函数计算的资源调度与运行以函数为单位。不同函数彼此相互独立,互不影响。本文介绍如何通过控制

创建任务函数 2025-04-16 14:38

函数计算为您提供了一个全托管、开箱即用、可观测的大规模任务处理平台,您可以通过

创建GPU函数 2025-04-16 14:38

如果您需要使用流行AI项目,如Stable Diffusion WebUI、ComfyUI、RAG、TensorRT等底层需要使用GPU实例来加速计算的应用,推荐以镜像方式部署函数应用。将容器镜像作为函数的交付物,提升开发和交付效率。 创建函数

Serverless GPU概述 2025-04-16 14:38

Serverless GPU是一种新兴的云计算GPU服务,它采用了服务器无感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细功能和优势。 传统GPU长驻使用方式存在许多

GPU云产品选型决策指引 2025-04-16 14:38

传统GPU使用场景存在资源利用率低、使用成本高和弹性能力弱等痛点问题,而Serverless GPU提供了一种更加灵活的方式来利用GPU计算资源,您只需根据自己的实际需求选择合适的GPU型号和计算资源规模即可。本文介绍如何根据您的业务情况选择不同的GPU云产品以及应用场景。 GPU选型指引请参见以下

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号