Europace 专访

2017 年 4 月 6 日作者 Brian Brazil

继续我们的 Prometheus 用户系列专访，来自 Europace 的 Tobias Gesellchen 将与我们分享他们是如何发现 Prometheus 的。

能介绍一下 Europace 是做什么的吗？

Europace AG 开发并运营基于网络的 EUROPACE 金融市场，这是德国最大的抵押贷款、住房金融产品和个人贷款平台。一个完全集成的系统连接了大约 400 个合作伙伴——银行、保险公司和金融产品分销商。每个月，数千名用户在 EUROPACE 上执行约 35,000 笔交易，总价值高达 40 亿欧元。我们的工程师定期在 http://tech.europace.de/ 和 @EuropaceTech 上发表博客。

在使用 Prometheus 之前，您的监控体验是怎样的？

其他项目仍在使用 Nagios/Icinga，但随着服务数量的增长和对灵活性需求的提高，我们开始寻找其他解决方案。由于 Nagios 和 Icinga 更多是集中式维护，而 Prometheus 则符合我们团队内部拥有完整 DevOps 技术栈的目标，并将特定的职责从基础设施团队转移到项目成员手中。

你们为什么决定研究 Prometheus？

通过参加 Docker 柏林社区的活动，我们接触到了 SoundCloud 和 Julius Volz，他们为我们做了很好的概述。灵活的 Docker 容器与高度灵活的基于标签的概念相结合，说服我们尝试一下 Prometheus。Prometheus 的安装非常简单，而 Alertmanager 也满足了我们的需求，所以我们没有理由去尝试其他替代方案。就连我们为改善 Docker 环境和消息传递工具集成而提交的一些小的拉取请求，也很快被合并了。随着时间的推移，我们为这个技术栈添加了几个 exporter 和 Grafana。我们从未后悔，也从未寻找过替代品。

Grafana dashboard for Docker Registry

你们是如何过渡的？

我们的团队在一个新项目中引入了 Prometheus，所以团队内部并没有发生迁移。其他团队则从并行添加 Prometheus 到现有解决方案开始，然后逐步迁移指标收集器。自定义 exporter 和其他临时服务在迁移过程中提供了帮助。Grafana 已经存在，所以我们不必考虑其他的仪表盘。一些项目仍然同时使用 Icinga 和 Prometheus。

切换后你们看到了哪些改进？

由于可扩展性问题，我们使用 Icinga 时遇到了困难——多个团队维护一个集中管理的解决方案效果不佳。使用 Prometheus 技术栈以及 Alertmanager 使我们的团队和项目解耦。Alertmanager 现在能够以高可用性模式部署，这对我们监控基础设施的核心来说是一个巨大的改进。

您认为 Europace 和 Prometheus 的未来会怎样？

我们公司其他团队也逐渐在他们的项目中采用了 Prometheus。我们预计会有更多的项目引入 Prometheus 和 Alertmanager，并慢慢取代 Icinga。凭借 Prometheus 固有的灵活性，我们相信它能够随我们的需求扩展，并且我们不会在适应未来需求方面遇到问题。