查询示例
简单时间序列选择
返回所有指标名为 http_requests_total 的时间序列
http_requests_total
返回所有指标名为 http_requests_total 且包含指定 job 和 handler 标签的时间序列
http_requests_total{job="apiserver", handler="/api/comments"}
返回同一向量的整个时间范围(本例中为查询时间点前的 5 分钟),将其转换为范围向量 (range vector)
http_requests_total{job="apiserver", handler="/api/comments"}[5m]
请注意,生成范围向量的表达式不能直接绘图,但可以在表达式浏览器的表格(“Console”)视图中查看。
使用正则表达式,您可以仅选择名称匹配特定模式的作业的时间序列,本例中为所有以 server 结尾的作业
http_requests_total{job=~".*server"}
要选择除 4xx 以外的所有 HTTP 状态码,可以运行
http_requests_total{status!~"4.."}
子查询
返回 http_requests_total 指标在过去 30 分钟内的 5 分钟速率 (rate),分辨率为 1 分钟。
rate(http_requests_total[5m])[30m:1m]
这是一个嵌套子查询的示例。deriv 函数的子查询使用默认分辨率。请注意,不必要地使用子查询是不明智的。
max_over_time(deriv(rate(distance_covered_total[5s])[30s:5s])[10m:])
使用函数、操作符等
返回所有指标名为 http_requests_total 的时间序列在过去 5 分钟内的每秒速率
rate(http_requests_total[5m])
假设所有的 http_requests_total 时间序列都具有 job(按作业名称扇出)和 instance(按作业实例扇出)标签,我们可能希望对所有实例的速率求和,这样可以减少输出的时间序列数量,同时保留 job 维度
sum by (job) (
rate(http_requests_total[5m])
)
如果我们有两个具有相同维度标签的不同指标,我们可以对它们应用二元操作符,两边具有相同标签集的元素将被匹配并传播到输出。例如,此表达式返回每个实例的未使用内存(MiB)(在一个虚构的集群调度器上,它会暴露这些关于其运行实例的指标)
(instance_memory_limit_bytes - instance_memory_usage_bytes) / 1024 / 1024
同样的表达式,按应用程序求和,可以这样写
sum by (app, proc) (
instance_memory_limit_bytes - instance_memory_usage_bytes
) / 1024 / 1024
如果同样的虚构集群调度器为每个实例暴露了如下 CPU 使用率指标
instance_cpu_time_ns{app="lion", proc="web", rev="34d0f99", env="prod", job="cluster-manager"}
instance_cpu_time_ns{app="elephant", proc="worker", rev="34d0f99", env="prod", job="cluster-manager"}
instance_cpu_time_ns{app="turtle", proc="api", rev="4d3a513", env="prod", job="cluster-manager"}
instance_cpu_time_ns{app="fox", proc="widget", rev="4d3a513", env="prod", job="cluster-manager"}
...
...我们可以按应用程序 (app) 和进程类型 (proc) 分组,获取 CPU 使用率前 3 名,如下所示
topk(3, sum by (app, proc) (rate(instance_cpu_time_ns[5m])))
假设此指标每个运行的实例包含一个时间序列,您可以像这样统计每个应用程序的运行实例数
count by (app) (instance_cpu_time_ns)
如果我们正在探索一些指标的标签,以便能够对它们中的一些进行聚合,我们可以使用以下方法
limitk(10, app_foo_metric_bar)
或者,如果我们希望返回的时间序列采样更均匀,我们可以使用以下方法获取大约 10% 的时间序列
limit_ratio(0.1, app_foo_metric_bar)