赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 弹性容器实例 ECI
  4. 操作指南
  5. Knative
  6. Knative最佳实践
  7. 查看Knative服务监控大盘

查看Knative服务监控大盘

  • Knative最佳实践
  • 发布于 2025-04-15
  • 1 次阅读
文档编辑
文档编辑

ACK集群已经兼容阿里云Prometheus和Grafana,无需您自建监控系统和可视化大盘。在Knative中部署业务应用后,您可以将Knative服务的监控数据接入Prometheus,通过Grafana大盘实时查看Kantive的响应延迟、请求并发数、CPU和内存资源用量等数据。

前提条件

  • 已在集群中部署Knative,请参见部署Knative。

  • 已为集群开启阿里云Prometheus监控,且Prometheus Agent(探针)版本大于3.0.0。具体操作,请参见开启阿里云Prometheus监控。

    说明

    关于查看Prometheus探针的控制台入口,请参见探针管理。

费用说明

将Knative服务的监控数据接入阿里云Prometheus监控功能后,相关组件会自动将监控指标发送至阿里云Prometheus服务,这些指标将被视为自定义指标。使用自定义指标会引起额外的费用。

为避免产生额外的费用,建议在启用此功能前,仔细阅读阿里云Prometheus的计费概述,了解自定义指标的收费策略。费用将根据您的集群规模和应用数量等因素产生变动。您可以通过资源消耗统计功能,监控和管理您的资源使用情况。

将Knative接入阿里云Prometheus监控

  1. 登录ARMS控制台。

  2. 在左侧的导航栏,单击接入中心,然后在页面的搜索栏输入Knative。

  3. 单击Knative资源卡片,根据页面信息提示,选择待接入的容器服务集群和配置信息。

    配置项

    描述

    接入名称

    Knative监控的名称。

    metrics采集间隔(秒)

    监控数据采集时间间隔。

  4. 配置完成后,单击确定。

查看Knative监控大盘

  1. 登录ARMS控制台。

  2. 在左侧的导航栏,单击接入管理,然后单击已接入组件。

  3. 单击Knative资源卡片,然后单击大盘列表页签,单击具体大盘名称,在Grafana查看Knative监控大盘的详情数据。

说明

在Knative面板,您可以查看Targets、指标、服务发现配置、Exporter等信息。更多信息,请参见容器服务接入。

分类

说明

请求数据

在Overview区域,查看Knative的请求量(Request Volume)、请求成功率(Success Rate)、4xx(客户端错误)、5xx(服务器端错误)和Pod扩缩容趋势的监控数据。

说明

Request Volume、4xx和5xx的大盘图标纵轴ops/sec表示每秒处理请求数。

overview

响应延迟数据

在Response Time区域,查看Knative的响应延迟数据,包括P50、P90、P95和P99。time

请求并发数

在Autoscaler区域,查看Knative的请求并发数的详细数据。请求并发数

资源使用量情况

在Resource Usages区域,查看Knative的资源使用量情况,包括CPU和内存。use

查看Knative服务发现关键指标

在ARMS控制台左侧导航栏,单击接入管理,在右侧页面的已接入环境的容器环境页签下,单击对应Prometheus服务实例的名称。在容器环境页面,单击指标采集,查看Knative服务发现指标。以下介绍Knative服务发现关键指标。

说明
  • 当Knative应用缩容到0且没有Pod实例时,Prometheus无法采集Pod的并发请求数、Pod每秒请求数等指标。只有访问Knative应用Pod后,控制台才会展示这些指标。

  • 当Knative应用没有缩容到0时,无需访问Knative应用Pod,控制台便会展示Pod的并发请求数、Pod每秒请求数等指标。

指标名称

说明

queue_average_concurrent_requests

Pod的并发请求数。

queue_requests_per_second

Pod每秒请求数。

revision_request_latencies

响应延迟。

revision_request_count

Revision请求数。

相关文档

您可以基于SLS实现日志采集和监控告警,请参见在Knative上实现日志采集、为Knative服务开启监控告警。

相关文章

在Knative中部署AI模型推理服务的最佳实践 2025-04-15 17:15

Knative和AI结合提供了快速部署、高弹性和低成本的技术优势,适用于需要频繁调整计算资源的AI应用场景,例如模型推理等。您可以通过Knative Pod部署AI模型推理任务,配置自动扩缩容、灵活分配GPU资源等功能,提高AI推理服务能力和GPU资源利用率。 加速模型部署 为了保证Knative

通过Knative事件驱动实现消息发送 2025-04-15 17:15

Knative是一款基于Kubernetes的开源Serverless应用编排框架,其目标是制定云原生、跨平台的Serverless应用编排标准。ACK Serverless Knative基于容器服务 Serverless 版之上,在完全兼容社区Knative的同时,支持事件驱动、自动弹性。本文通

查看Knative服务监控大盘 2025-04-15 17:15

ACK集群已经兼容阿里云Prometheus和Grafana,无需您自建监控系统和可视化大盘。在Knative中部署业务应用后,您可以将Knative服务的监控数据接入Prometheus,通过Grafana大盘实时查看Kantive的响应延迟、请求并发数、CPU和内存资源用量等数据。

基于Knative部署生产级别的Stable Diffusion服务 2025-04-15 17:15

使用Knative在ACK集群中部署Stable Diffusion时,Knative支持根据单个Pod处理请求的吞吐率精准地控制单个Pod请求并发处理数,保证服务稳定性,还能在业务没有流量时自动将实例缩容至零,节省GPU资源的使用成本。 前提条件 已

基于KServe快速部署一个推理服务 2025-04-15 17:15

KServe是一个基于Kubernetes的机器学习模型服务框架,支持以Kubernetes CRD的形式将单个或多个经过训练的模型(例如TFServing、TorchServe、Triton等推理服务器)部署到模型服务运行时,使得模型的部署、更新和扩展变得更加简单快捷。本文介绍如何在Knative

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号