与 Europace 的访谈
2017年4月6日作者 Brian Brazil
在我们持续进行的Prometheus用户访谈系列中,来自Europace的Tobias Gesellchen讲述了他们是如何发现Prometheus的。
您能介绍一下Europace是做什么的吗?
Europace AG 开发并运营着基于网络的 EUROPACE 金融市场,该市场是德国最大的抵押贷款、建筑金融产品和个人贷款平台。一个完全集成的系统连接着约400家合作伙伴——银行、保险公司和金融产品分销商。每月有数千用户在EUROPACE上执行约35,000笔交易,总价值高达40亿欧元。我们的工程师定期在 http://tech.europace.de/ 和 @EuropaceTech 上发布博客。
您在使用Prometheus之前的监控经验是怎样的?
Nagios/Icinga 仍用于其他项目,但随着服务数量的增长和对灵活性更高的需求,我们开始寻找其他解决方案。由于Nagios和Icinga更多是集中维护的,Prometheus符合我们将完整的DevOps堆栈引入团队,并将特定职责从基础设施团队转移到项目成员的目标。
您为什么决定考虑Prometheus?
通过我们在 Docker Berlin 社区 的活动,我们与 SoundCloud 和 Julius Volz 取得了联系,他们为我们提供了很好的概述。灵活的Docker容器与高度灵活的基于标签的概念相结合,说服我们尝试Prometheus。Prometheus的设置足够简单,Alertmanager也满足了我们的需求,因此我们没有理由尝试其他替代方案。即使是我们为改善Docker环境和消息工具集成而提交的小型拉取请求也很快被合并了。随着时间的推移,我们在堆栈中添加了多个导出器和Grafana。我们从未后悔或寻找过替代方案。
您是如何进行过渡的?
我们的团队在一个新项目中引入了Prometheus,所以我们团队内部并没有发生过渡。其他团队开始将Prometheus与现有解决方案并行部署,然后逐步迁移指标收集器。自定义导出器和其他临时服务在迁移过程中提供了帮助。Grafana已经存在,所以我们无需考虑另一个仪表盘。有些项目仍然并行使用Icinga和Prometheus。
切换后您看到了哪些改进?
我们之前使用Icinga时遇到了可扩展性问题——多个团队维护一个集中管理解决方案的效果不佳。使用Prometheus堆栈以及Alertmanager解耦了我们的团队和项目。Alertmanager现在能够以 高可用模式 部署,这对我们监控基础设施的核心是一个巨大的改进。
您认为Europace和Prometheus的未来会是怎样的?
我们公司的其他团队也已逐渐在他们的项目中采用了Prometheus。我们预计将有更多项目引入Prometheus以及Alertmanager,并逐步取代Icinga。凭借Prometheus固有的灵活性,我们预计它将随着我们的需求扩展,并且我们在适应未来需求时不会遇到问题。