Loki_alert

简直太开心了,终于找到了解决这么多天未解之谜的方法了,开心到飞起。 https://community.grafana.com/t/including-full-log-error-message-in-alert-notification-using-loki/87113 sum by(message) (count_over_time({filename="/var/log/latest.log"} |= `error` | pattern `<message>` [11s])) 这篇文章真的帮了我的大忙,通过最近一段时间的研究,我发

Flask部署

部署重启supervisor部署flask应用 [root@wud wud]# supervisorctl status flask_git RUNNING pid 27984, uptime 5 days, 22:10:48 nginx RUNNING pid 26304, uptime 0:00:03 [root@wud wud]# supervisorctl status flask_git flask_git RUNNING pid 27984, uptime 5 days, 22:10:56 [root@wud wud]# supervisorctl restart flask_git

grafana_alert概念与配置

这一块对于应用监控而言是不可缺少的存在,如果某个指标超过了某个阈值,我们就必须要将这个超过阈值的信息给通过邮件或者电话通知出去,而不能单纯的

应用运维

应用运维领域离不开三大监控利器,metrics(指标),logs(日志),traces(链路)。 指标最大的采集利器就是 Prometheus 日志的话,容器应用会

Grafana入门

对于grafana是一个非常强大的探索指标跟视图绘制的一个工具,里面会有图标的suggestion. datasource explore transformation 非常有用的数据变换 suggestion 通过配置多选参

Prometheus入门

Prometheus是对接容器监控的唯一标准组件,可以部署很多采集任务,去对接docker,k8s,非侵入式采集相关的指标。每个采集任务其实