运维工作总结

距离去年7月到应用运维岗,已经快一年了,总的来说,收获很大。

经历了两个比较大的项目,总体也了解了目前行内相关应用对应的现状,也经历过一些生产事件。对很多东西的理解也进一步加深。今天也算是对过去的一个总结,也是对未来的一个展望。

应用运维什么最关键,应用一个架构,监控的日志,关键的指标有哪些。自动化的应用变更,监控的spl语句如何写,有哪些平台跟工具,是我们关键跟重要的。

我还有哪些东西需要加强,我还有竞争力吗?

运维工具,关键的工具体系?

  • Prometheus,Grafana,PromQL
  • es,flink,clickhouse+对应的spl语句
  • linux的命令功底
  • 关于应用的分析思路,tps,耗时,系统失败,业务失败,智能基线(box算法)
  • 应用如何去通过链路去分析呢?
  • k8s如何部署应用呢?
  • 运维排障的思路——>运维平台是什么? 故障快照,出现故障,快速反馈查询结果
  • PLR
  • Gloden分布式数据库,redis,kafka,sloth,es

在AI盛行的今天,做知识分享还有必要吗?

打造属于自己个人的知识体系,个人能力还是很重要的。

AI是工具,AI+个人知识+个人想法+行动力——>这些要素才是成就的个人的关键。

原来的那些知识壁垒跟经验都给工具学去了,你原来不能做的,你现在能做了吗?问问自己

你想要做什么?做一个用AI做什么系列。

  • 做一个基金网站?
    • 基金历史数据的爬取
    • 做基金的定时爬取
    • 做基金的曲线展示
    • 做基金的分析(按照同类型,全市场去排名,找到合适的基金代码)
  • 做一个运维知识网站?
    • Linux,基础很多脚本shell
    • java,
    • 前端
    • python,pandas,
    • PromQL,SPL,SQL
  • 做一个可视化的平台? Grafana,echart
  • 做一个数据分析的专家?
  • 做一个流程平台,工作流
  • 做一个计划调度平台
  • 做一个运维agent
  • 做一个分布式系统运维的知识分享(ruoyi)

做以上工作,是否有一个通用的框架呢?

一个前端,后端,数据库,加docker部署,k8s部署

产品说明,AI(总结一些使用技巧),加行动力。

一下子做不完,我们就分批实现。