alertmanager介绍案例

韵味老鸟 2024-07-04 17:49:47

alertmanager 介绍案例

group_by: [instance] # 报警分组

group_wait: 30s # 在组内等待所配置的时间,如果同组内,30秒内出现相同报警,在一个组内出现。

group_interval: 5m # 每个分组中最多每5分钟发送一条警报

repeat_interval: 1h # 发送报警间隔,如果指定时间内没有修复,则重新发送报警。

告警时间说明#在1m内收到Prometheus发来相同告警情况下认为告警已经恢复resolve_timeout: 1m#告警分组规则,例如,这里表示具有相同alertname值的告警会被分为一组。这个值是可以修改的,并不一定是alertnamegroup_by: ['alertname']在一个新的告警分组被创建后,需要等待group_wait指定的时间来初始化通知,这种方式可以确保有足够的时间为同一分组获取多条告警,然后一起发送这些告警到接收人group_wait: 30s同一组告警发送时间间隔,如果一个组第一次告警已经发送,则等待group_interval时间再来发送组内新的告警group_interval: 5m#重复告警间隔时间,如果一条告警已经发送成功,则需要等待repeat_interval时间才能重新发送repeat_interval: 3h

###

mute_time_intervals ##指定可以在路由树中引用的命名时间间隔,以在一天中的特定时间使特定路由静音time_intervals ##包含时间间隔的实际定义

#

receiver:根据receiver的name把告警送到receiver

group_by:此处填写标签的key,根据key将Alert分组,同一组的组合到一起发给receiver

continue:告警与子route匹配之后是否应该往下走

match和matchers:key-value的匹配规则

group_wait:一个新group的告警被构建出来后,等待若干时间再发送。期间有新的告警的话都组合到一起。

group_interval:已有group的告警,等待若干时间再发送。

repeat_interval:等待若干时间后重新发送

mute_time_intervals:覆盖全局的mute_time_intervals配置

- mute_time_intervals告警静默规则:mute_time_interval:- name: <string> time_intervals: [ - <time_interval> ... ]

# 根路由,如果它们未被覆盖,则由子路由继承route:receiver: 'default-receiver'group_wait: 30sgroup_interval: 5mrepeat_interval: 4hgroup_by: [cluster, alertname]# 未匹配的所有警报将由'default-receiver'处理routes:# 跟 service=mysql 或 service=cassandra 匹配的告警将由database-pager处理- receiver: 'database-pager'group_wait: 10smatchers:- service=~"mysql|cassandra"# 与team=frontend匹配的警报由frontend-pager处理,它们根据product, environment分组- receiver: 'frontend-pager'group_by: [product, environment]matchers:- team="frontend"# 所有与service=inhouse-service匹配的告警由该路由处理。该路由将在offhours和holidays期间静默,由于配置了continue: true,如果匹配,警报将继续执行下一个路由- receiver: 'dev-pager'matchers:- service="inhouse-service"mute_time_intervals:- offhours- holidayscontinue: true# 所有与service=inhouse-service匹配的警报由该路由处理。该路由仅在offhours 和holidays 期间处理。- receiver: 'on-call-pager'matchers:- service="inhouse-service"active_time_intervals:- offhours- holidays

time_interval

指定用于静默或激活路由的时间间隔,该命名可以在路由配置中引用。

所有与service=inhouse-service匹配的告警由该路由处理。该路由将在offhours和holidays期间静默- receiver: 'dev-pager'matchers:- service="inhouse-service"mute_time_intervals:- offhours- holidays
0 阅读:0