与 Europace 的访谈

继续我们对 Prometheus 用户的一系列访谈,来自 Europace 的 Tobias Gesellchen 将讲述他们是如何发现 Prometheus 的。

你能介绍一下 Europace 是做什么的吗?

Europace AG 开发并运营基于网络的 EUROPACE 金融市场,该平台是德国最大的抵押贷款、建筑融资产品和个人贷款平台。一个完全集成的系统连接了大约 400 个合作伙伴——银行、保险公司和金融产品分销商。每月有数千名用户在 EUROPACE 上执行约 35,000 笔交易,总价值高达 40 亿欧元。我们的工程师定期在 http://tech.europace.de/@EuropaceTech 上发布博客。

您使用 Prometheus 之前的监控经验是什么?

Nagios/Icinga 仍然用于其他项目,但随着服务数量的增长和对灵活性的更高需求,我们寻找了其他解决方案。由于 Nagios 和 Icinga 更偏向于集中维护,Prometheus 符合我们的目标,即在我们的团队中拥有完整的 DevOps 堆栈,并将特定职责从我们的基础设施团队转移到项目成员。

您为什么决定考虑 Prometheus?

通过我们在 Docker Berlin 社区 的活动,我们与 SoundCloudJulius Volz 取得了联系,他们给了我们一个很好的概述。灵活的 Docker 容器与高度灵活的基于标签的概念相结合,说服我们尝试一下 Prometheus。Prometheus 的设置非常简单,Alertmanager 也满足我们的需求,因此我们没有理由尝试其他替代方案。甚至我们为改进 Docker 环境和消息传递工具中的集成而提交的少量拉取请求也很快被合并了。随着时间的推移,我们向堆栈中添加了多个导出器和 Grafana。我们从未回头或寻找替代方案。

Grafana dashboard for Docker Registry

您是如何过渡的?

我们的团队在一个新项目中引入了 Prometheus,因此过渡并非在我们的团队中发生。其他团队开始将 Prometheus 与现有解决方案并排添加,然后逐步迁移指标收集器。自定义导出器和其他临时服务在迁移期间提供了帮助。Grafana 已经存在,因此我们不必考虑其他仪表板。一些项目仍然并行使用 Icinga 和 Prometheus。

自切换以来您看到了哪些改进?

由于可伸缩性问题,我们在使用 Icinga 时遇到了问题——多个团队维护一个集中管理的解决方案效果不佳。使用 Prometheus 堆栈以及 Alertmanager 解耦了我们的团队和项目。Alertmanager 现在能够以 高可用模式部署,这对我们监控基础设施的核心是一个巨大的改进。

您认为 Europace 和 Prometheus 的未来会怎样?

我们公司的其他团队已经在他们的项目中逐步采用了 Prometheus。我们预计会有更多项目引入 Prometheus 以及 Alertmanager,并逐渐取代 Icinga。凭借 Prometheus 固有的灵活性,我们预计它将随着我们的需求进行扩展,并且我们在适应未来需求时不会遇到问题。