prometheus 不同告警分发到不同团队 part3
8.运维组告警配置
a.调整 dev 和 qa 里rules的阈值,避免触发
b.调整 comm里的阈值,触发到运维团队,包括所有target
c.alertmanager 里的配置
- receiver: feishu-alert-yunwei group_by: [cluster] matchers: - severity=~"critical|Critical" group_interval: 10s group_wait: 10s repeat_interval: 1m - receiver: feishu-alert-yunwei group_by: [cluster] matchers: - severity=~"warning|Warning" group_interval: 10s group_wait: 10s repeat_interval: 1m可以去掉 group_by 这个匹配参数,可以让匹配标签更加的广
d.告警截图(prometheus)
飞书通知截图(仅发送到yunwei团队)
内存告警
CPU告警(未体现集群标签,依据查询指标数值引起)
t通过不通的分组,实现告警触达