Alertmanager 处理 Prometheus 服务器发送的告警,并根据告警的标签将通知发送给不同的接收方。
接收方可以是多种不同的集成之一,例如 PagerDuty、Slack、电子邮件,或者通过通用 webhook 接口实现的自定义集成(例如 JIRA)。
模板
发送给接收方的消息通过模板构建。Alertmanager 带有默认模板,但也允许定义自定义模板。
在这篇博客文章中,我们将逐步介绍一个简单的 Slack 通知自定义。
我们使用这个简单的 Alertmanager 配置,它将所有告警发送到 Slack
global:
slack_api_url: '<slack_webhook_url>'
route:
receiver: 'slack-notifications'
# All alerts in a notification have the same value for these labels.
group_by: [alertname, datacenter, app]
receivers:
- name: 'slack-notifications'
slack_configs:
- channel: '#alerts'
默认情况下,Alertmanager 发送的 Slack 消息看起来是这样的
它向我们展示了一个正在触发的告警,接着是告警分组的标签值 (alertname, datacenter, app),以及告警共有的其他标签值 (critical)。
自定义
如果您收到告警,您也应该有关于如何处理它们的文档——一本运行手册(runbook)。一个好的方法是建立一个 wiki,其中包含您运行的每个应用程序的一个章节,以及每个告警的一个页面。
假设我们在 https://internal.myorg.net/wiki/alerts
运行着这样一个 wiki。现在我们希望在 Slack 消息中显示这些运行手册的链接。
在我们的模板中,我们需要访问 "alertname" 和 "app" 标签。由于这些是我们用来对告警进行分组的标签,因此它们在我们模板数据的 GroupLabels
映射中可用。
我们可以直接将自定义模板添加到 Alertmanager 的 Slack 配置中,用于 Slack 消息的 text
部分。模板语言是 Go 编程语言提供的。
global:
slack_api_url: '<slack_webhook_url>'
route:
- receiver: 'slack-notifications'
group_by: [alertname, datacenter, app]
receivers:
- name: 'slack-notifications'
slack_configs:
- channel: '#alerts'
# Template for the text field in Slack messages.
text: 'https://internal.myorg.net/wiki/alerts/{{ .GroupLabels.app }}/{{ .GroupLabels.alertname }}'
我们通过发送 SIGHUP
信号或重启来重新加载 Alertmanager,以加载更改的配置。完成。
我们的 Slack 通知现在看起来是这样的
模板文件
或者,我们也可以提供一个包含命名模板的文件,然后由 Alertmanager 加载。这对于跨越多行的更复杂模板特别有用。
我们创建一个文件 /etc/alertmanager/templates/myorg.tmpl
并在其中创建一个名为 "slack.myorg.text" 的模板。
{{ define "slack.myorg.text" }}https://internal.myorg.net/wiki/alerts/{{ .GroupLabels.app }}/{{ .GroupLabels.alertname }}{{ end}}
我们的配置现在会为 "text" 字段加载给定名称的模板,并且我们提供自定义模板文件的路径
global:
slack_api_url: '<slack_webhook_url>'
route:
- receiver: 'slack-notifications'
group_by: [alertname, datacenter, app]
receivers:
- name: 'slack-notifications'
slack_configs:
- channel: '#alerts'
text: '{{ template "slack.myorg.text" . }}'
templates:
- '/etc/alertmanager/templates/myorg.tmpl'
我们通过发送 SIGHUP
信号或重启来重新加载 Alertmanager,以加载更改的配置和新的模板文件。完成。
要测试和迭代您的 Prometheus Alertmanager Slack 通知模板,您可以使用以下工具。