赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 日志服务
  4. 操作指南
  5. 时序存储
  6. 最佳实践
  7. 为时序库创建告警

为时序库创建告警

  • 最佳实践
  • 发布于 2025-04-22
  • 0 次阅读
文档编辑
文档编辑

日志服务支持PromQL、SQL以及PromQL+SQL三种时序数据查询与分析语法,允许您根据特定的查询需求设定告警规则,实现对关键指标的精准监控与即时告警通知。本文向您介绍为时序库创建告警规则的一些常见案例。

使用PromQL语句查询分析并创建告警

  1. 在时序库查询界面,参考下图,使用PromQL语法查询请求量的增长率。然后单击右上角另存为告警,将当前的PromQL语句保存成告警。

    rate(apiserver_request_total[1m])

    image

  2. 在创建告警页面,配置规则名称、检查频率、触发条件和输出目标等参数项,然后点击确定。详细步骤请参见快速设置日志告警。

使用SQL+PromQL语法查询分析并创建告警

  1. 在时序库页面,单击更多操作 > 自定义分析,进入到同名日志库查询页面。

    image

  2. 在日志库查询页面,使用SQL语法与日志服务提供PromQL函数进行嵌套查询预览,然后单击右上角的告警,设置日志告警。以下为您提供常见的设置告警案例。

    • up指标表示进程的存活状态,使用下面的告警策略可判断进程是否存活。

      * | select promql_query('up == 0') from metrics limit 1000
    • process_resident_memory_bytes表示常驻内存,下面的告警策略表示“若实例的常驻内存大于8GB”则告警。

      * | select promql_query('process_resident_memory_bytes/1024/1024/1024 > 8') from metrics limit 1000
    • 若CPU使用率大于500%则告警,告警策略中的SQL可参考下文。

      * | select promql_query('rate(process_cpu_seconds_total[1m]) > 5') from metrics limit 1000
    • 若Go进程中协程数量大于500则告警,告警策略中的SQL可参考下文。

      * | select promql_query('sum by(instance) (go_goroutines) > 500') from metrics limit 1000
    • 若GC时间过长则发出告警,告警策略中的SQL可参考下文。

      * | select promql_query('sum(rate(go_gc_duration_seconds_sum[1m])) by (instance) /sum(rate(go_gc_duration_seconds_count[1m])) by (instance) > 0.1') from metrics limit 1000

    image

相关文章

使用Prometheus采集Kubernetes监控数据 2025-04-22 10:58

本文介绍如何在Kubernetes上部署Prometheus,将监控数据采集到日志服务MetricStore中,并将日志服务MetricStore对接到Grafana实现监控数据可视化展示。 前提条件 <

MetricStore HTTP API详情 2025-04-22 10:58

日志服务提供多个用于查询时序指标或写入指标数据到MetricStore的API,这些API兼容Prometheus开源协议。本文介绍这些API的使用详情。 概述 Prometheus所提供的接口都在/api/v1目录下,MetricStore相关的API同样遵循此规则,其完整的URL为https:/

函数计算场景中使用Prometheus SDK上报时序数据 2025-04-22 10:58

SLS SDK支持写入时序数据,但手动维护一系列自定义指标的方式较为繁琐。Prometheus能自动生成多种维度的监控指标并内置维护标签信息,然而,它通常要求对外暴露一个HTTP接口,通过第三方采集器以Pull模式拉取时序数据。在函数计算场景中,由于计算服务无法直接提供此类HTTP接口,无法通过前述

PromQL与SQL查询时序库常用案例 2025-04-22 10:58

本文介绍利用PromQL或SQL查询时序数据库的常见应用场景。 PromQL基础使用案例 查询单指标数据 process_resident_memory_bytes表示常驻内存,使用下面的PromQL可直接查看进程各时间的指标数据。

PromQL函数使用示例 2025-04-22 10:58

日志服务提供PromQL函数对时序库中的指标进行处理。本文介绍PromQL函数常用示例。 abs() abs()函数会计算时序数据中所有点的绝对值,使用方式如下。

为时序库创建告警 2025-04-22 10:58

日志服务支持PromQL、SQL以及PromQL+SQL三种时序数据查询与分析语法,允许您根据特定的查询需求设定告警规则,实现对关键指标的精准监控与即时告警通知。本文向您介绍为时序库创建告警规则的一些常见案例。 使用PromQL语句查询分析并创建告警 在时序库查询界面,参考下图,使用PromQL语法

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号