赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 分布式云容器平台ACK One
  4. 操作指南
  5. 分布式工作流Argo集群
  6. 可观测性
  7. 使用Prometheus监控服务

使用Prometheus监控服务

  • 可观测性
  • 发布于 2025-04-18
  • 0 次阅读
文档编辑
文档编辑

工作流集群集成阿里云ARMS Prometheus服务,提供完善的可观测能力。您可以查看工作流运行状况和集群的健康状况。本文介绍如何在工作流集群中开启和使用Prometheus监控服务。

前提条件

  • 已开通分布式云容器平台ACK One。

  • 已开通阿里云弹性容器实例ECI。

  • 已开通ARMS。

  • 已创建分布式工作流Argo集群。

  • 已安装阿里云CLI并配置凭证,且CLI版本为3.0.167及以上。具体操作,请参见安装阿里云CLI和配置凭证。

  • 已授予RAM用户AliyunAdcpFullAccess权限。具体操作,请参见为RAM用户授权。

说明

如果您的工作流集群未能正常开启集群监控,请提交工单联系容器服务团队。也可加入钉钉群(钉钉群号:35688562)进行反馈。

计费说明

工作流集群监控会引起额外的费用,建议在启用此功能前,仔细阅读计费说明。

开启Prometheus监控服务

通过控制台开启

  1. 登录ACK One控制台,在左侧导航栏选择工作流集群 > 集群监控。

  2. 在集群监控页面,单击开启工作流集群监控,然后单击确定,开启工作流集群监控。

通过命令开启

  1. 执行以下命令,获取工作流集群的ClusterID。

    aliyun adcp DescribeHubClusters --Profile=XFlow
  2. 执行以下命令,开启Prometheus监控服务。

    aliyun adcp UpdateHubClusterFeature --MonitorEnabled true --ClusterId <cluster id>

    Prometheus监控服务开启后,将为该工作流实例自动创建一个ARMS Prometheus实例。

  3. 查看Prometheus监控大盘。

    1. 登录ACK One控制台,在左侧导航栏选择工作流集群。

    2. 在工作流集群页面的常用操作区域,单击应用实时监控服务ARMS跳转至大盘列表页面。

      您可以查看集群的运行状况和更详尽的信息,包括工作流运行状态、APIServer、etcd、Pod信息等。

    3. 在大盘列表页面,单击ACKOne-ArgoWorkflow大盘,查看工作流运行状况。

      123.png

关闭Prometheus监控服务

通过控制台关闭

  1. 登录ACK One控制台,在左侧导航栏选择工作流集群 > 集群监控。

  2. 在集群监控页面,单击右侧关闭功能,然后单击确定,关闭工作流集群监控。

通过命令关闭

  1. 执行以下命令,关闭Prometheus监控服务。

aliyun adcp UpdateHubClusterFeature --MonitorEnabled false --ClusterId <cluster id>

相关文章

使用Prometheus监控服务 2025-04-18 18:08

工作流集群集成阿里云ARMS Prometheus服务,提供完善的可观测能力。您可以查看工作流运行状况和集群的健康状况。本文介绍如何在工作流集群中开启和使用Prometheus监控服务。 前提条件

使用日志服务 2025-04-18 18:08

工作流完成时,一般需要配置工作流和Pod的回收策略清理相应的资源,以避免集群控制面和工作流控制器资源的线性增长。当工作流出现问题或需要进行流程分析时,查看工作流日志是一个必不可少的能力。由于原生的集群在Pod清理后就不能查看Pod或工作流日志,因此,工作流集群集成了阿里云日志服务SLS,收集工作流运

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号