赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 分布式云容器平台ACK One
  4. 操作指南
  5. 多集群舰队
  6. GitOps
  7. 运维管理
  8. 配置ACK One ArgoCD告警

配置ACK One ArgoCD告警

  • 运维管理
  • 发布于 2025-04-18
  • 0 次阅读
文档编辑
文档编辑

ACK One的舰队监控基于可观测监控Prometheus版的监控指标,提供了舰队自身的监控大盘,您可以根据自身需求自定义告警规则,实时监控相关指标。本文介绍如何配置ACK One ArgoCD告警。

前提条件

  • 已开启舰队监控。具体操作,请参见开启舰队监控。

  • 已创建通知对象。相关信息,请参见告警通知对象。

    说明

    若您通知对象配置为钉钉,需要在钉钉机器人安全设置中添加自定义关键词告警。相关信息,请参见钉钉官方文档。

配置ACK One ArgoCD告警

  1. 登录ACK One控制台,在左侧导航栏选择舰队 > 舰队可观测 > 舰队监控。

  2. 在舰队监控页面右上角,单击报警设置,进入Prometheus告警规则页面。

  3. 单击创建Prometheus告警规则,完成下列配置后单击完成。更多详细信息,请参见创建Prometheus告警规则模板。

    配置信息

    说明

    示例

    告警名称

    自定义告警的名称。

    ACK One ArgoCD Pod内存告警。

    检测类型

    可选静态阈值、自定义PromQL。

    选择静态阈值。

    Prometheus实例

    填入您的ACK One舰队名称。

    text-XXXX。

    告警分组

    您环境所需监控的Kubernetes分组。

    Kubernetes负载。

    告警指标

    请根据实际需求选择。重点关注容器内存使用率和容器CPU使用率。

    容器内存使用率。

    告警条件

    基于告警指标预置内容设置告警事件产生条件。

    当容器CPU使用率大于80%时,满足告警条件。

    筛选条件

    根据告警指标,设置当前配置的告警规则所适用的范围,即所有符合筛选条件的资源满足此条告警规则时,均会产生告警事件。

    可选筛选条件包括:

    • 遍历:告警规则适用于当前Prometheus实例下的所有资源。筛选条件默认为遍历。

    • 等于:选择该条件后,需继续输入具体资源名称。所创建的告警规则将仅适用于对应资源。不支持同时填写多个资源。

    • 不等于:选择该条件后,需继续输入具体资源名称。所创建的告警规则将适用于除该资源之外的其他资源。不支持同时填写多个资源。

    • 正则匹配:选择该条件后,按需输入正则表达式匹配相应的资源名称。所创建的告警规则将适用于符合该正则表达式的所有资源。

    • 正则不匹配:选择该条件后,按需输入正则表达式匹配相应的资源名称。所创建的告警规则将过滤符合该正则表达式的所有资源。

    命名空间等于argocd,Pod:遍历,容器:遍历。

    持续时间

    • 当告警条件满足时,直接产生告警事件:任何一个数据点满足阈值,就会产生告警事件。

    • 当告警条件满足持续N分钟时,才产生告警事件:即只有当满足阈值的时间大于等于N分钟时,才产生告警事件。

    当告警条件满足持续1分钟时,才产生告警事件。

    告警等级

    自定义告警等级。默认告警等级为默认,告警严重程度从默认、P4、P3、P2、P1逐级上升。

    P1。

    告警内容

    用户收到的告警信息。您可以使用Go template语法在告警内容中自定义告警参数变量。

    命名空间:{{$labels.namespace}} / Pod: {{$labels.pod_name}} / 容器:{{$labels.container}} CPU使用率{{$labels.metrics_params_opt_label_value}} {{$labels.metrics_params_value}}%, 当前值{{ printf "%.2f" $value }}%

    告警通知

    可选极简模式或普通模式。

    选择极简模式。

    通知对象

    请根据实际需求选择告警通知对象。

    钉钉告警。

    通知时段

    请根据实际需求填写告警通知时间段。

    23:00至01:00。

    重复策略

    请根据实际需求填写每隔几分钟,进行告警重复通知。

    告警每隔10分钟重复通知。

  4. 配置完成后,触发告警条件,可在告警通知对象侧查看告警信息。

    说明

    可通过Prometheus控制台查看告警发送历史,具体信息,请参见查看告警发送历史。

相关文章

开启GitOps控制面日志与审计日志 2025-04-18 18:11

GitOps功能开启后,ArgoCD Server和ArgoCD Application Controller等ArgoCD的控制面日志、访问ArgoCD Server的审计日志等将被收集到日志服务SLS中。您可以通过开启GitOps控制面日志与审计日志功能进行查看。本文介绍如何开启和关闭GitOp

配置ACK One ArgoCD告警 2025-04-18 18:11

ACK One的舰队监控基于可观测监控Prometheus版的监控指标,提供了舰队自身的监控大盘,您可以根据自身需求自定义告警规则,实时监控相关指标。本文介绍如何配置ACK One ArgoCD告警。 前提条件 已开启舰队监控。具体操作,请参见开启舰队监控

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号