Prometheus部署+Grafana可视化+Alertmanager邮件告警

老红的工作与禅 / 2024-02-01 / 原文

选型

我们单位自己开发的软件平台,需要自己来运维,正所谓不监控无运维,等着甲方来通知你服务挂了是一件很尴尬的事情。

在软件选型方面,监控工具简直是太多了,每个软件都有自己的领地,有的是偏向跟踪分析、有的是报警的、有的是日志收集、有的只监控硬件。

Prometheus、Nagios、Datadog、skywalking、zabbix、elk、SigNoz、Zipkin、Grafana、New Relic、Cacti、Munin……

因为单位将上线K8s,所以打算使用Prometheus。我们网管用zabbix,这个也挺好,功能丰富,拿来即用。

Prometheus部署

访问官网入门教程 https://prometheus.io/docs/prometheus/2.45/getting_started/#

启动一个最基本的Prom实例。