Europace 专访
2017 年 4 月 6 日作者 Brian Brazil
继续我们的 Prometheus 用户系列专访,来自 Europace 的 Tobias Gesellchen 将与我们分享他们是如何发现 Prometheus 的。
能介绍一下 Europace 是做什么的吗?
Europace AG 开发并运营基于网络的 EUROPACE 金融市场,这是德国最大的抵押贷款、住房金融产品和个人贷款平台。一个完全集成的系统连接了大约 400 个合作伙伴——银行、保险公司和金融产品分销商。每个月,数千名用户在 EUROPACE 上执行约 35,000 笔交易,总价值高达 40 亿欧元。我们的工程师定期在 http://tech.europace.de/ 和 @EuropaceTech 上发表博客。
在使用 Prometheus 之前,您的监控体验是怎样的?
其他项目仍在使用 Nagios/Icinga,但随着服务数量的增长和对灵活性需求的提高,我们开始寻找其他解决方案。由于 Nagios 和 Icinga 更多是集中式维护,而 Prometheus 则符合我们团队内部拥有完整 DevOps 技术栈的目标,并将特定的职责从基础设施团队转移到项目成员手中。
你们为什么决定研究 Prometheus?
通过参加 Docker 柏林社区 的活动,我们接触到了 SoundCloud 和 Julius Volz,他们为我们做了很好的概述。灵活的 Docker 容器与高度灵活的基于标签的概念相结合,说服我们尝试一下 Prometheus。Prometheus 的安装非常简单,而 Alertmanager 也满足了我们的需求,所以我们没有理由去尝试其他替代方案。就连我们为改善 Docker 环境和消息传递工具集成而提交的一些小的拉取请求,也很快被合并了。随着时间的推移,我们为这个技术栈添加了几个 exporter 和 Grafana。我们从未后悔,也从未寻找过替代品。

你们是如何过渡的?
我们的团队在一个新项目中引入了 Prometheus,所以团队内部并没有发生迁移。其他团队则从并行添加 Prometheus 到现有解决方案开始,然后逐步迁移指标收集器。自定义 exporter 和其他临时服务在迁移过程中提供了帮助。Grafana 已经存在,所以我们不必考虑其他的仪表盘。一些项目仍然同时使用 Icinga 和 Prometheus。
切换后你们看到了哪些改进?
由于可扩展性问题,我们使用 Icinga 时遇到了困难——多个团队维护一个集中管理的解决方案效果不佳。使用 Prometheus 技术栈以及 Alertmanager 使我们的团队和项目解耦。Alertmanager 现在能够以高可用性模式部署,这对我们监控基础设施的核心来说是一个巨大的改进。
您认为 Europace 和 Prometheus 的未来会怎样?
我们公司其他团队也逐渐在他们的项目中采用了 Prometheus。我们预计会有更多的项目引入 Prometheus 和 Alertmanager,并慢慢取代 Icinga。凭借 Prometheus 固有的灵活性,我们相信它能够随我们的需求扩展,并且我们不会在适应未来需求方面遇到问题。