宣布 Prometheus 3.0

2024年11月14日作者 Prometheus 团队

继在柏林 PromCon 大会上发布 Prometheus 3.0 测试版 之后,Prometheus 团队很高兴宣布 Prometheus 3.0 版本现已发布!

此最新版本标志着一个重要的里程碑,因为它是 7 年来的第一个主要版本。在此期间,Prometheus 取得了长足发展,从一个早期采用者的项目演变为云原生监控堆栈的标准组成部分。Prometheus 3.0 旨在通过增加一些令人兴奋的新功能,同时在很大程度上保持与以前版本的稳定性和兼容性来延续这一历程。

完整的 3.0 版本在测试版的基础上增加了一些新功能,并引入了一些我们将在本文中描述的额外重大变更。

新功能

以下是作为测试版发布以来的激动人心的变更以及此后新增功能的摘要:

新用户界面

Prometheus 3.0 的亮点之一是其全新的用户界面,该界面默认启用。

New UI query page

用户界面已完全重写,减少了杂乱,外观更现代,并增加了新功能,例如 PromLens 风格的树状视图,并且通过使用更现代的技术栈,将使未来的维护变得更容易。

有关新用户界面的更多信息,请参阅 Julius 在 PromLabs 博客上的详细文章。用户可以通过使用 old-ui 功能标志暂时启用旧的用户界面。

由于新用户界面尚未经过实战检验,因此仍可能存在错误。如果您发现任何问题,请在 GitHub 上报告

自测试版发布以来,用户界面已更新以支持 UTF-8 指标和标签名称。

New UTF-8 UI

远程写入 2.0

远程写入 2.0 在之前的协议版本基础上进行了迭代,增加了对元数据、示例、创建时间戳和原生直方图等一系列新元素的本地支持。它还使用字符串驻留来减少压缩和解压缩时的有效负载大小和 CPU 使用率。对于部分写入有更好的处理,以便在此发生时向客户端提供更多详细信息。更多详情请参阅此处

UTF-8 支持

Prometheus 现在默认允许在指标和标签名称中使用所有有效的 UTF-8 字符,以及标签值,这在 2.x 版本中就已经如此。

用户需要确保其指标生产者配置为传递 UTF-8 名称,如果任何一方不支持 UTF-8,指标名称将使用传统的下划线替换方法进行转义。PromQL 查询可以使用新的引用语法来检索 UTF-8 指标,或者用户可以手动指定 __name__ 标签名称。

目前只有 Go 客户端库已更新以支持 UTF-8,但对其他语言的支持将很快添加。

OTLP 支持

为了与我们对 OpenTelemetry 的承诺保持一致,Prometheus 3.0 包含了多项新功能,旨在提高与 OpenTelemetry 的互操作性。

OTLP 摄取

Prometheus 可以配置为 OTLP 指标协议的原生接收器,在 /api/v1/otlp/v1/metrics 端点接收 OTLP 指标。

请参阅我们的指南,了解将 OTLP 指标流量导入 Prometheus 的最佳实践。

UTF-8 规范化

借助 Prometheus 3.0,得益于UTF-8 支持,用户可以存储和查询 OpenTelemetry 指标,而无需对指标和标签名称进行烦人的更改,例如将点更改为下划线

值得注意的是,这减少了用户和工具在 OpenTelemetry 语义约定或 SDK 中定义的内容与实际可查询内容之间的差异所造成的困惑

为实现 OTLP 摄取,Prometheus 3.0 实验性地支持不同的转换策略。有关详细信息,请参阅Prometheus 配置中的 otlp 部分

注意虽然“NoUTF8EscapingWithSuffixes”策略允许特殊字符,但它仍然会添加必要的后缀以提供最佳体验。请参阅关于未来在 Prometheus 中启用无后缀功能的提案

原生直方图

原生直方图是一种 Prometheus 指标类型,与经典直方图相比,它提供了更高的效率和更低的成本替代方案。原生直方图并非必须根据数据集选择(并可能需要更新)桶边界,而是具有基于指数增长的预设桶边界。

原生直方图仍处于实验阶段,默认未启用,可以通过传递 --enable-feature=native-histograms 启用。原生直方图的某些方面,如文本格式和访问器函数/运算符,仍在积极设计中。

重大变更

Prometheus 社区致力于在主要版本中不破坏现有功能。随着新主要版本的发布,我们借此机会清理了一些长期存在但较小的问题。换句话说,Prometheus 3.0 包含一些重大变更。这包括对功能标志、配置文件、PromQL 和抓取协议的更改。

请阅读迁移指南,了解您的设置是否受影响以及需要采取哪些措施。

性能

看到自 Prometheus 2.0 以来我们在社区中取得的成就,令人印象深刻。我们都喜欢数字,所以让我们庆祝我们在 TSDB 模式下对 CPU 和内存使用所做的效率改进。下面是 3 个 Prometheus 版本在具有 8 个 CPU 和 49 GB 可分配内存的节点上的性能数据。

  • 2.0.0 (7 年前)
  • 2.18.0 (4 年前)
  • 3.0.0 (现在)

Memory bytes

CPU seconds

更令人印象深刻的是,这些数据是使用我们的 prombench 宏基准测试 获得的,该测试使用相同的 PromQL 查询、配置和环境——突出了核心功能的向后兼容性和稳定性,即使是 3.0 版本也不例外。

下一步计划

Prometheus 及其生态系统仍有大量令人兴奋的功能和改进空间。以下是一个非详尽列表,希望能让您兴奋起来……并激励您贡献并加入我们!

  • 新的、更具包容性的治理
  • 更多 OpenTelemetry 兼容性和功能
  • OpenMetrics 2.0,现已归 Prometheus 治理!
  • 原生直方图的稳定性(以及自定义桶!)
  • 更多优化!
  • 更多 SDK 和工具中的 UTF-8 支持覆盖

试用一下!

您可以通过我们的官方二进制文件容器镜像下载并试用 Prometheus 3.0。

如果您正在从 Prometheus 2.x 升级,请查阅迁移指南,了解您需要进行的任何调整。请注意,我们强烈建议您在升级到 v3.0 之前先升级到 v2.55。可以从 v3.0 回滚到 v2.55,但不能回滚到更早的版本。

一如既往,我们欢迎社区的反馈和贡献!