查询示例
简单时间序列选择
返回所有指标名为 http_requests_total
的时间序列
http_requests_total
返回所有指标名为 http_requests_total
且带有给定 job
和 handler
标签的时间序列
http_requests_total{job="apiserver", handler="/api/comments"}
返回相同向量的完整时间范围(在此示例中为查询时间点前的 5 分钟),使其成为一个时间序列向量
http_requests_total{job="apiserver", handler="/api/comments"}[5m]
请注意,生成时间序列向量的表达式不能直接绘制图表,但可以在表达式浏览器的表格(“Console”)视图中查看。
使用正则表达式,您可以仅选择名称匹配特定模式的作业的时间序列,在此示例中,是所有以 server
结尾的作业。
http_requests_total{job=~".*server"}
要选择除 4xx 以外的所有 HTTP 状态码,您可以运行
http_requests_total{status!~"4.."}
子查询
返回过去 30 分钟内 http_requests_total
指标的 5 分钟速率,分辨率为 1 分钟。
rate(http_requests_total[5m])[30m:1m]
这是一个嵌套子查询的示例。deriv
函数的子查询使用默认分辨率。请注意,不必要地使用子查询是不明智的。
max_over_time(deriv(rate(distance_covered_total[5s])[30s:5s])[10m:])
使用函数、运算符等
返回所有指标名为 http_requests_total
的时间序列的每秒速率,测量周期为过去 5 分钟。
rate(http_requests_total[5m])
假设所有 http_requests_total
时间序列都带有 job
(按作业名称扇出)和 instance
(按作业实例扇出)标签,我们可能希望对所有实例的速率求和,这样可以减少输出时间序列的数量,但仍保留 job
维度。
sum by (job) (
rate(http_requests_total[5m])
)
如果两个不同指标具有相同的维度标签,我们可以对它们应用二元运算符,并且两侧具有相同标签集的元素将进行匹配并传播到输出。例如,此表达式返回每个实例(在虚构的集群调度器上,它暴露了关于其运行实例的这些指标)的未使用内存(MiB)。
(instance_memory_limit_bytes - instance_memory_usage_bytes) / 1024 / 1024
相同的表达式,但按应用程序求和,可以这样编写:
sum by (app, proc) (
instance_memory_limit_bytes - instance_memory_usage_bytes
) / 1024 / 1024
如果相同的虚构集群调度器为每个实例暴露了如下的 CPU 使用指标:
instance_cpu_time_ns{app="lion", proc="web", rev="34d0f99", env="prod", job="cluster-manager"}
instance_cpu_time_ns{app="elephant", proc="worker", rev="34d0f99", env="prod", job="cluster-manager"}
instance_cpu_time_ns{app="turtle", proc="api", rev="4d3a513", env="prod", job="cluster-manager"}
instance_cpu_time_ns{app="fox", proc="widget", rev="4d3a513", env="prod", job="cluster-manager"}
...
...我们可以按应用程序 (app
) 和进程类型 (proc
) 分组,获取前 3 个 CPU 使用者,如下所示:
topk(3, sum by (app, proc) (rate(instance_cpu_time_ns[5m])))
假设此指标包含每个运行实例的一个时间序列,您可以像这样计算每个应用程序的运行实例数量:
count by (app) (instance_cpu_time_ns)
如果我们要探索某些指标的标签,以便能够对其中一些进行聚合,我们可以使用以下方式:
limitk(10, app_foo_metric_bar)
另外,如果我们希望返回的时间序列采样更均匀,我们可以使用以下方式获取大约 10% 的时间序列:
limit_ratio(0.1, app_foo_metric_bar)