赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 日志服务
  4. 操作指南
  5. 机器学习语法
  6. 时序SQL
  7. 时序聚类函数

时序聚类函数

  • 时序SQL
  • 发布于 2025-04-22
  • 0 次阅读
文档编辑
文档编辑

时序聚类函数针对输入的多条时序数据进行聚类,自动聚类出不同的曲线形态,进而快速找到相应的聚类中心和异于聚类中的其它形态曲线。

关于函数的算法及实现原理请参见LOG机器学习介绍(02):时序聚类建模。

函数列表

函数

说明

ts_density_cluster

使用密度聚类方法对多条时序数据进行聚类。

ts_hierarchical_cluster

使用层次聚类方法对多条时序数据进行聚类。

ts_similar_instance

查找到指定曲线名称的相似曲线。

ts_density_cluster

函数格式如下所示:

select ts_density_cluster(x, y, z) 

参数说明如下所示:

参数

说明

取值

x

时间列,从小到大排列。

Unixtime时间戳,单位为秒。

y

数值列,对应某时刻的数据。

无

z

某个时刻数据对应的曲线名称。

字符串类型,例如machine01.cpu_usr。

示例:

  • 查询分析语句如下所示:

    * and (h: "machine_01" OR h: "machine_02" OR h : "machine_03") | select ts_density_cluster(stamp, metric_value,metric_name ) from ( select '("__time__" - ("__time__" % 600))' as stamp, avg(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY metric_name, stamp ) 
  • 输出结果如下所示:输出结果

显示项如下所示:

显示项

说明

cluster_id

聚类的类别,其中-1表示未能划分到某一聚类中心。

rate

该聚类中的instance占比。

time_series

该聚类中心的时间戳序列。

data_series

该聚类中心的数据序列。

instance_names

该聚类中心包含的instance的集合。

sim_instance

该类中的某一个instance名称。

ts_hierarchical_cluster

函数格式如下所示:

select ts_hierarchical_cluster(x, y, z) 

参数说明如下所示:

参数

说明

取值

x

时间列,从小到大排列。

格式为Unixtime时间戳,单位为秒。

y

数值列,对应某时刻的数据。

无

z

某个时刻数据对应的曲线名称。

字符串类型,例如machine01.cpu_usr。

示例:

  • 查询分析语句如下所示:

    * and (h: "machine_01" OR h: "machine_02" OR h : "machine_03") | select ts_hierarchical_cluster(stamp, metric_value, metric_name) from ( select '("__time__" - ("__time__" % 600))' as stamp, avg(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY metric_name, stamp )
  • 输出结果如下所示:输出结果

显示项如下所示:

显示项

说明

cluster_id

聚类的类别,其中-1表示未能划分到某一聚类中心。

rate

该聚类中的instance占比。

time_series

该聚类中心的时间戳序列。

data_series

该聚类中心的数据序列。

instance_names

该聚类中心包含的instance的集合。

sim_instance

该类中的某一个instance名称。

ts_similar_instance

函数格式如下所示:

select ts_similar_instance(x, y, z,instance_name,topK,metricType) 

参数说明如下所示:

参数

说明

取值

x

时间列,从小到大排列。

格式为Unixtime时间戳,单位为秒。

y

数值列,对应某时刻的数据。

无

z

某个时刻数据对应的曲线名称。

字符串类型,例如machine01.cpu_usr。

instance_name

指定某个待查找的曲线名称。

集合中某个曲线名称,字符串类型,例如machine01.cpu_usr。

说明

必须是已创建的曲线。

topK

最多返回K个与给定曲线相似的曲线。

无

metricType

{'shape', 'manhattan', 'euclidean'},衡量时序曲线之间的相似性指标。

无

查询分析语句如下所示:

* and m: NET and m: Tcp and (h: "nu4e01524.nu8" OR  h: "nu2i10267.nu8" OR  h : "nu4q10466.nu8") | select ts_similar_instance(stamp, metric_value, metric_name, 'nu4e01524.nu8' ) from ( select '("__time__" - ("__time__" % 600))' as stamp, sum(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY  metric_name, stamp )

显示项如下所示:

显示项

说明

instance_name

与指定指标相近的结果列表。

time_series

该曲线的时间戳序列。

data_series

该曲线的数据序列。

相关文章

平滑函数 2025-04-22 10:42

平滑函数是针对输入的时序曲线进行平滑和简单的滤波操作,滤波操作通常是发现时序曲线形态的第一步。 函数列表

多周期估计函数 2025-04-22 10:42

多周期估计函数支持对不同时间段内的时序进行周期估计,通过傅立叶变换等一系列操作进行周期的提取。 函数列表

变点检测函数 2025-04-22 10:42

变点检测函数一般用于对时序数据中的变点进行检测。 变点检测函数支持对如下两种变点形态进行检测: 指定时间段内的某些统计特性发生了变化。

极大值检测函数 2025-04-22 10:42

极大值检测函数用于在指定窗口中寻找序列的局部极大值。 ts_find_peaks

预测与异常检测函数 2025-04-22 10:42

预测与异常检测函数通过预测时序曲线、寻找预测曲线和实际曲线之间误差的Ksigma与分位数等特性进行异常检测。 关于函数的算法及原理请参见:

序列分解函数 2025-04-22 10:42

序列分解函数提供针对业务曲线的分解功能,突出曲线的趋势信息和周期信息。 ts_decompose

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号