采访 Europace
2017年4月6日作者 Brian Brazil
在我们对 Prometheus 用户的系列采访中,来自 Europace 的 Tobias Gesellchen 讲述了他们是如何发现 Prometheus 的。
你能介绍一下 Europace 是做什么的吗?
Europace AG 开发并运营着基于网络的 EUROPACE 金融市场平台,这是德国最大的抵押贷款、建筑金融产品和个人贷款平台。作为一个全集成系统,它连接了约 400 个合作伙伴,包括银行、保险公司和金融产品分销商。每月有几千名用户在 EUROPACE 上进行约 35,000 笔交易,总金额高达 40 亿欧元。我们的工程师经常在 http://tech.europace.de/ 和 @EuropaceTech 上发表博文。
在使用 Prometheus 之前,您的监控体验是怎样的?
Nagios /Icinga 在其他项目中仍在使用,但随着服务数量的增加和对灵活性要求的提高,我们寻找了其他解决方案。由于 Nagios 和 Icinga 更偏向于集中式维护,而 Prometheus 符合我们在团队内部实现完整 DevOps 栈的目标,并将特定职责从基础设施团队转移到项目成员身上。
你们为什么决定研究 Prometheus?
通过我们在 Docker Berlin 社区 的活动,我们与 SoundCloud 以及 Julius Volz 取得了联系,他们为我们提供了很好的概览。灵活的 Docker 容器与高度灵活的基于标签(label-based)的概念相结合,让我们决定尝试一下 Prometheus。Prometheus 的安装非常简单,Alertmanager 也满足了我们的需求,因此我们没有理由去尝试其他替代方案。即便我们提交了一些用于改进 Docker 环境集成以及与消息工具集成的小型 pull request,也都被非常迅速地合并了。随着时间的推移,我们在栈中添加了多个导出器(exporters)和 Grafana。我们从不后悔,也从未寻找过替代品。

你们是如何过渡的?
我们的团队在一个新项目中引入了 Prometheus,所以团队内部并不存在所谓的“转型”。其他团队则是通过将 Prometheus 与现有解决方案并行添加,然后逐步迁移指标采集器(metrics collectors)来开始的。自定义导出器和其他临时服务在迁移过程中提供了帮助。Grafana 当时已经存在,所以我们不必考虑其他仪表板。一些项目目前仍在并行使用 Icinga 和 Prometheus。
切换后你们看到了哪些改进?
我们曾经在使用 Icinga 时遇到扩展性问题——多个团队维护一个集中管理的解决方案效果并不理想。使用 Prometheus 栈配合 Alertmanager 将我们的团队和项目解耦了。Alertmanager 现在可以部署在 高可用模式 下,这对我们监控基础设施的核心部分是一项巨大的改进。
您认为 Europace 和 Prometheus 的未来会怎样?
公司里的其他团队也已经逐渐在他们的项目中采用了 Prometheus。我们预计会有更多的项目引入 Prometheus 和 Alertmanager,并慢慢取代 Icinga。凭借 Prometheus 固有的灵活性,我们相信它能够随我们的需求而扩展,并且我们在适应未来要求时也不会遇到任何问题。