使用 Node Exporter 监控 Linux 主机指标

Prometheus Node Exporter 能够公开各种硬件和内核相关的指标。

在本指南中,您将:

  • localhost 上启动 Node Exporter
  • localhost 上启动一个 Prometheus 实例,并配置其从运行中的 Node Exporter 抓取指标
注意虽然 Prometheus Node Exporter 适用于 *nix 系统,但也有适用于 Windows 的 Windows exporter ,其用途类似。

安装并运行 Node Exporter

Prometheus Node Exporter 是一个单一的静态二进制文件,您可以通过压缩包进行安装。从 Prometheus 下载页面下载后,解压并运行即可:

# NOTE: Replace the URL with one from the above mentioned "downloads" page.
# Node Exporter is available for multiple OS targets and architectures.
# Downloads are available at:
# https://github.com/prometheus/node_exporter/releases/download/v<VERSION>/node_exporter-<VERSION>.<OS>-<ARCH>.tar.gz
#
# <VERSION>, <OS>, and <ARCH> are placeholders:
# - <VERSION>: Release version (e.g., 1.10.2)
# - <OS>: Operating system (e.g., linux, darwin, freebsd)
# - <ARCH>: Architecture (e.g., amd64, arm64, 386)
#
# For this example, we will use Node Exporter version 1.10.2 for a Linux system with amd64 architecture.

wget https://github.com/prometheus/node_exporter/releases/download/v1.10.2/node_exporter-1.10.2.linux-amd64.tar.gz
tar xvfz node_exporter-1.10.2.linux-amd64.tar.gz
cd node_exporter-1.10.2.linux-amd64
./node_exporter

您应该会看到类似如下的输出,表明 Node Exporter 正在运行并在 9100 端口公开指标:

INFO[0000] Starting node_exporter (version=0.16.0, branch=HEAD, revision=d42bd70f4363dced6b77d8fc311ea57b63387e4f)  source="node_exporter.go:82"
INFO[0000] Build context (go=go1.9.6, user=root@a67a9bc13a69, date=20180515-15:53:28)  source="node_exporter.go:83"
INFO[0000] Enabled collectors:                           source="node_exporter.go:90"
INFO[0000]  - boottime                                   source="node_exporter.go:97"
...
INFO[0000] Listening on :9100                            source="node_exporter.go:111"

Node Exporter 指标

Node Exporter 安装并运行后,您可以通过访问 /metrics 端点来验证指标是否正在导出:

curl https://:9100/metrics

您应该会看到类似如下的输出:

# HELP go_gc_duration_seconds A summary of the GC invocation durations.
# TYPE go_gc_duration_seconds summary
go_gc_duration_seconds{quantile="0"} 3.8996e-05
go_gc_duration_seconds{quantile="0.25"} 4.5926e-05
go_gc_duration_seconds{quantile="0.5"} 5.846e-05
# etc.

成功!Node Exporter 现在正在公开 Prometheus 可以抓取的指标,包括输出中更靠后位置的各种系统指标(以 node_ 为前缀)。要查看这些指标(以及帮助和类型信息):

curl https://:9100/metrics | grep "node_"

配置您的 Prometheus 实例

为了访问 Node Exporter 的指标,需要对您本地运行的 Prometheus 实例进行正确配置。以下 prometheus.yml 示例配置文件将告知 Prometheus 实例通过 localhost:9100 从 Node Exporter 抓取指标及其抓取频率:

global:
  scrape_interval: 15s

scrape_configs:
- job_name: node
  static_configs:
  - targets: ['localhost:9100']

要安装 Prometheus,请下载适用于您平台的最新版本并解压:

wget https://github.com/prometheus/prometheus/releases/download/v*/prometheus-*.*-amd64.tar.gz
tar xvf prometheus-*.*-amd64.tar.gz
cd prometheus-*.*

安装完成后,您可以使用 --config.file 标志指向您在上方创建的配置文件来启动 Prometheus:

./prometheus --config.file=./prometheus.yml

通过 Prometheus 表达式浏览器探索 Node Exporter 指标

现在 Prometheus 正在从运行中的 Node Exporter 实例抓取指标,您可以使用 Prometheus UI(即表达式浏览器)来探索这些指标。在浏览器中导航至 localhost:9090/graph,并使用页面顶部的表达式主栏输入表达式。表达式栏如下所示:

Prometheus expressions browser

Node Exporter 特有的指标以 node_ 为前缀,包括 node_cpu_seconds_totalnode_exporter_build_info 等指标。

点击下方链接查看一些指标示例:

指标含义
rate(node_cpu_seconds_total{mode="system"}[1m])过去一分钟内,每秒消耗在系统模式下的 CPU 时间平均值(单位:秒)
node_filesystem_avail_bytes非 root 用户可用的文件系统空间(单位:字节)
rate(node_network_receive_bytes_total[1m])过去一分钟内,每秒接收到的网络流量平均值(单位:字节)

本页内容