免责声明:Prometheus 会自动处理由其配置的告警规则生成的告警。强烈建议基于时间序列数据在 Prometheus 中配置告警规则,而不是实现直接客户端。
Alertmanager 有两个 API,v1 和 v2,都监听告警。下面代码片段描述了 v1 的方案。v2 的方案被指定为 OpenAPI 规范,可以在Alertmanager 存储库中找到。客户端应在告警仍然处于活动状态时持续重新发送告警(通常为 30 秒到 3 分钟)。客户端可以通过 POST 请求向 Alertmanager 推送告警列表。
每个告警的标签用于识别告警的相同实例并执行重复数据删除。注释始终设置为最近收到的注释,并且不识别告警。
startsAt
和 endsAt
时间戳都是可选的。如果省略 startsAt
,则 Alertmanager 将分配当前时间。仅当知道告警的结束时间时才设置 endsAt
。否则,它将设置为自上次收到告警以来可配置的超时时间。
generatorURL
字段是一个唯一的反向链接,用于标识此告警在客户端中的导致实体。
[
{
"labels": {
"alertname": "<requiredAlertName>",
"<labelname>": "<labelvalue>",
...
},
"annotations": {
"<labelname>": "<labelvalue>",
},
"startsAt": "<rfc3339>",
"endsAt": "<rfc3339>",
"generatorURL": "<generator_url>"
},
...
]
本文档是开源的。请通过提交问题或拉取请求来帮助改进它。