promtheus使用技巧及运维记录(二)

韵味老鸟 2024-06-26 17:58:41

promtheus 使用技巧及运维记录(二)

Q3:多接受者

routes: - match: alertname: A_down receiver: - default-receiver - TeamA - match: alertname: B_down receiver: - default-receiver - TeamB #子路由 routes: - receiver: 'wechat_web' match_re: department: 'web' - receiver: 'wechat_api' match_re: department: 'api'

Q2:alertmanager 匹配规则

Q1:group_by

这里有一个group_by的参数,它的作用就是将相同k/v的标签放到一个组里

配置了分组后,200条告警发送到alertmanager,一看标签都是一样那就分到一个组里,合并成一条告警进行发送

group_by: ['alertname','team'] #在这里添加team匹配的标签

当有多个标签匹配时,有任意标签k/v不相同时,就不会分为同一组(可以按照不同集群来分发)

route: group_by: ['alertname', 'app'] # 分组时使用的标签,默认情况下,所有的告警都组织在一起,而一旦指定分组标签,则Alertmanager将按这些标签进行分组; group_wait: 30s # 发出一组告警通知的初始等待时长;允许等待一个抑制告警到达或收集属于同一组的更多初始告警,通常是0到数分钟; group_interval: 40s # 发送关于新告警的消息之前,需要等待多久;新告警将被添加到已经发送了初始通知的告警组中;一般在5分钟或以上; repeat_interval: 1m # 成功发送了告警后再次发送告警信息需要等待的时长,一般至少为3个小时;
0 阅读:0