Europace 访谈

2017年4月6日作者 Brian Brazil

继续我们关于 Prometheus 用户访谈的系列,来自 Europace 的 Tobias Gesellchen 谈论了他们是如何发现 Prometheus 的。

能介绍一下 Europace 做什么吗?

Europace AG  开发并运营基于网络的 EUROPACE 金融市场,它是德国最大的抵押贷款、住房融资产品和个人贷款平台。一个完全集成的系统连接了大约 400 家合作伙伴——银行、保险公司和金融产品分销商。每月有数千名用户在 EUROPACE 上执行约 35,000 笔交易,总价值高达 40 亿欧元。我们的工程师定期在 http://tech.europace.de/ @EuropaceTech  上撰写博文。

在使用 Prometheus 之前,您的监控体验是怎样的?

Nagios /Icinga  仍用于其他项目,但随着服务数量的增长和对灵活性的更高需求,我们开始寻找其他解决方案。由于 Nagios 和 Icinga 的集中管理程度更高,Prometheus 符合我们拥有团队中完整的 DevOps 技术栈并将其特定职责从基础设施团队转移到项目成员的目标。

你们为什么决定研究 Prometheus?

通过我们在 Docker Berlin 社区  的活动,我们接触了 SoundCloud Julius Volz ,他们给了我们一个很好的概述。灵活的 Docker 容器与高度灵活的基于标签的概念相结合,说服我们尝试 Prometheus。Prometheus 的设置足够简单,Alertmanager 也满足我们的需求,因此我们没有理由尝试其他替代方案。即使是我们改进 Prometheus 在 Docker 环境和消息工具中集成的微小 Pull Request,也很快被合并了。随着时间的推移,我们向技术栈中添加了几个 exporter 和 Grafana。我们从未后悔过,也没有寻找过替代方案。

Grafana dashboard for Docker Registry

你们是如何过渡的?

我们的团队在一个新项目中引入了 Prometheus,所以过渡并不是在我们团队内部发生的。其他团队开始时是将 Prometheus 与现有解决方案并存,然后逐步迁移指标收集器。自定义 exporter 和其他临时服务在迁移过程中提供了帮助。Grafana 已经存在,所以我们不必考虑另一个仪表板。一些项目仍同时使用 Icinga 和 Prometheus。

切换后你们看到了哪些改进?

我们在使用 Icinga 时遇到了可扩展性问题——多个团队维护一个集中管理的解决方案效果不佳。使用 Prometheus 技术栈以及 Alertmanager 解耦了我们的团队和项目。Alertmanager 现在能够部署在 高可用模式  下,这是我们监控基础设施核心的一大改进。

您认为 Europace 和 Prometheus 的未来会怎样?

我们公司的其他团队也逐渐在他们的项目中采用了 Prometheus。我们预计会有更多的项目引入 Prometheus 和 Alertmanager,并逐步取代 Icinga。凭借 Prometheus 内在的灵活性,我们预计它将随着我们的需求而扩展,并且我们不会遇到适应未来需求的难题。