作业和实例

在 Prometheus 的术语中，一个可供抓取的端点称为一个*实例*，通常对应一个进程。一组具有相同目的的实例（例如，为了可扩展性或可靠性而复制的进程）称为一个*作业*。

例如，一个具有四个复制实例的 API 服务器作业

作业：api-server
- 实例 1：1.2.3.4:5670
- 实例 2：1.2.3.4:5671
- 实例 3：5.6.7.8:5670
- 实例 4：5.6.7.8:5671

自动生成的标签和时间序列

当 Prometheus 抓取一个目标时，它会自动为抓取的时间序列附加一些标签，以识别被抓取的目标

如果这些标签中的任何一个已经存在于抓取的数据中，其行为取决于 honor_labels 配置选项。更多信息请参阅抓取配置文档。

对于每个实例的抓取，Prometheus 会在以下时间序列中存储一个样本

up{job="<job-name>", instance="<instance-id>"}：如果实例健康（即可达），则为 1，如果抓取失败，则为 0。
scrape_duration_seconds{job="<job-name>", instance="<instance-id>"}：抓取的持续时间。
scrape_samples_post_metric_relabeling{job="<job-name>", instance="<instance-id>"}：应用指标重标签后剩余的样本数量。
scrape_samples_scraped{job="<job-name>", instance="<instance-id>"}：目标公开的样本数量。
scrape_series_added{job="<job-name>", instance="<instance-id>"}：此次抓取中新增的大致系列数。v2.10 新增

up 时间序列对于实例可用性监控非常有用。

通过 extra-scrape-metrics 功能标志，还可以使用几个额外的指标

scrape_timeout_seconds{job="<job-name>", instance="<instance-id>"}：为目标配置的 scrape_timeout。
scrape_sample_limit{job="<job-name>", instance="<instance-id>"}：为目标配置的 sample_limit。如果未配置限制，则返回零。
scrape_body_size_bytes{job="<job-name>", instance="<instance-id>"}：如果抓取成功，则为最近一次抓取响应的未压缩大小。因超出 body_size_limit 而失败的抓取报告 -1，其他抓取失败报告 0。

本页内容